# Selenium
:一个用于 Web 自动化测试的开源项目。
- 官网 (opens new window)
- 发音为
/səˈliːniəm/
。 - Selenium 项目提供了多个工具:
- WebDriver :一个 HTTP 服务器,用于调用 Chrome、Firefox 等浏览器的 API 来访问网站。
- IDE :一个浏览器插件,用于记录用户在浏览器中的操作,记录成 Selenium 命令,便于快速创建测试用例。
- Grid :一个 Web 服务器,采用 Java 语言开发,用于在多个主机上执行 WebDriver 任务。
# WebDriver
# 安装
安装 webdriver 。
- 如果安装在本机,则需要安装 Chrome、Firefox 等浏览器,再安装对应版本的 webdriver 二进制文件。
- 也可以在其它主机部署 Grid 服务器,然后在本机调用。
安装 Python 的第三方库作为客户端:
pip install selenium
# 用法
例:在本机启动 webdriver 服务器
from selenium import webdriver driver = webdriver.Chrome() # 启动 webdriver 。这会创建一个 webdriver 子进程,它又会创建几个 Chrome 子进程 driver.quit() # 终止 webdriver
例:调用远程的 Grid 服务器
from selenium import webdriver from selenium.webdriver.common.desired_capabilities import DesiredCapabilities driver = webdriver.Remote( command_executor="http://10.0.0.1:4444", desired_capabilities=DesiredCapabilities.CHROME )
例:浏览网页
>>> driver.get('http://www.baidu.com') # 让浏览器返回一个 URL >>> driver.name # 获取浏览器的名称 'chrome' >>> driver.current_url # 获取当前网页的 URL 'https://www.baidu.com/' >>> driver.title # 获取当前网页的标题 '百度一下,你就知道' >>> driver.page_source # 获取当前网页的 HTML 内容 '<html><head><meta http-equiv="Content-Type" content="text/html;charset=utf-8">... >>> driver.save_screenshot('1.png') # 保存网页截图(即使调用 Grid ,也能保存到本机) True
例:在网页输入信息
>>> from selenium.webdriver.common.keys import Keys >>> e = driver.find_element_by_id('kw') # 查找 HTML 中的元素 >>> e.send_keys('hello') # 输入字符串 >>> e.send_keys(Keys.RETURN) # 输入一个键盘快捷键 >>> e.click()
例:切换浏览器的窗口
>>> driver.current_window_handle # 获取当前窗口的句柄 'CDwindow-C88E17197FCFDE3459E9E81F7498A3EA' >>> windows = driver.window_handles # 获取浏览器所有窗口的句柄,返回一个 list >>> driver.close() # 关闭当前窗口 >>> driver.switch_to.window(windows[0]) # 切换窗口
- 浏览器可以打开多个窗口,而 driver 同时只能操纵一个窗口。
# Grid
# 架构
Grid 包含以下组件:
- Node
- :负责执行 WebDriver 任务。
- 默认会自动发现本机上可用的 WebDriver ,注册到 Distributor 。
- 每个 Node 提供了一定数量的 slot ,用于执行客户端 session 的任务。
- Hub :包含以下组件:
- Router
- :作为 Grid 的入口,负责将客户端请求转发到对应的组件。
- 例如收到客户端请求时,如果属于已有会话,则转发到 Session Map ,否则转发到 New Session Queue 。
- Distributor
- 负责为每个新的会话分配 Node 来执行任务。
- Session Map
- 负责记录每个 Session ID ,与执行该 Session 任务的 Node 的对应关系。
- New Session Queue
- Event Bus
- 负责实现 Grid 各组件之间的通信。
- Router
- Node
Grid 可以部署成分布式集群,也可以以 Standalone 模式部署单节点。
# 部署
可以下载 jar 包,然后运行:
java -jar selenium-server.jar
或者用 docker-compose 部署:
version: '3' services: selenium: container_name: selenium image: selenium/standalone-chrome:131.0-20241204 restart: unless-stopped shm_size: 2g ports: - 4444:4444 # volumes: # - ./config.toml:/opt/selenium/config.toml
- 该 selenium 镜像会基于 supervisor 运行浏览器、webdriver、Grid 等多个进程。
- 容器启动时总是会重新生成配置文件 config.toml ,除非没有写入权限。可以挂载 config.toml ,内容示例:
[network] # relax-checks = true # 是否放宽检查客户端 HTTP 请求的 Headers、Content-Type [node] # detect-drivers = true # 是否自动发现本机上可用的 WebDriver # session-timeout = "300" # 如果一个 session 超过 n 秒未活动,则删除该 session # max-sessions = 1 # 每个 node 允许同时运行的 session 数,默认等于 CPU 核数 # override-max-sessions = false # 是否允许设置的 max-sessions 超过 CPU 核数 # drain-after-session-coun = 0 # 执行 n 个 session 之后,清空并关闭该 node ,这适合 k8s 的部署模式 [router] username = admin # 给网站开启 Basic Auth 认证 password = ****** # [server] # port = 4444
- 除了修改 config.toml 文件,也可添加环境变量来配置 selenium :
SE_NODE_SESSION_TIMEOUT: '70' SE_NODE_MAX_SESSIONS: '4' SE_NODE_OVERRIDE_MAX_SESSIONS: 'true'