用selenium python登录网站并抓取登录后的内容

Python | 2015-03-08 22:17:45 | 阅读 15383 次 | 评论(0)

以下代码仅作演示:


#!/usr/bin/env python
# -*- coding: UTF-8 -*-
from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait

browser = webdriver.Firefox()
browser.set_page_load_timeout(20)   # 防止页面加载个没完
browser.get('https://www.zhihu.com/')

browser.find_element_by_class_name("js-signin").click()   # 点击登录按钮,一般网站该步可省略

email = browser.find_element_by_xpath("//input[@name='email']")
email.clear()
email.send_keys("test@test.com")
password = browser.find_element_by_xpath("//input[@name='password']")
password.clear()
password.send_keys("12345678")
form = browser.find_element_by_xpath("//form[@class='zu-side-login-box']")
form.submit()

somedom = WebDriverWait(browser, 60).until(lambda brow: brow.find_elements_by_class_name("zu-main-feed-con"))[0]

html = somedom.find_element_by_xpath("//*").get_attribute("outerHTML")
print html
browser.quit()


文章评论,共0条
游客请输入验证码
浏览1906275次
文章归档
最新评论
  • Miss_Zou:目测是大佬
  • 神犇dengyuhy:语文很好
  • 猫云:学习 学习