Selenium是一个用于测试网站的自动化测试工具,支持各种浏览器包括Chrome、Firefox、Safari等主流界面浏览器,同时也支持phantomJS无界面浏览器。 通过此行代码可以快速在Python中安装selen
Selenium是一个用于测试网站的自动化测试工具,支持各种浏览器包括Chrome、Firefox、Safari等主流界面浏览器,同时也支持phantomJS无界面浏览器。
通过此行代码可以快速在Python中安装selenium库
pip install Selenium
另外,我们仍需要安装浏览器驱动
Selenium3.x调用浏览器必须有一个webdriver驱动文件
Chrome驱动文件下载:点击下载chromedrive
Firefox驱动文件下载:点击下载geckodriver
首先是打开chrome浏览器并跳转到某个页面
chrome_options = Options()
# “–no-sandbox”参数是让Chrome在root权限下跑
chrome_options.add_argument('--no-sandbox')
chrome_options.add_argument('--disable-dev-shm-usage')
chrome_options.add_argument('--headless') # “–headless”参数是不用打开图形界面
driver = webdriver.Chrome(chrome_options=chrome_options)
driver.delete_all_cookies() # 清除cookie
login_url = ""
driver.get(login_url)
# print("登录页面加载成功")
Selenium提供了8种定位方式,可以获取元素
都可以通过
find_elements 或 find_element
实现获取,用法:
1. 找到所有满足条件的页面元素
driver.find_elements(By.XPATH, 路径)
2. 通过下标来选择第几个
driver.find_elements(By.XPATH, 路径)[0]
其中XPATH也可以换成name/class/id等等
甚至也可以使用选择器