# Selenium

:一个用于 Web 自动化测试的开源项目。

  • 官网 (opens new window)
  • 发音为 /səˈliːniəm/
  • Selenium 项目提供了多个工具:
    • WebDriver :一个 HTTP 服务器,用于调用 Chrome、Firefox 等浏览器的 API 来访问网站。
    • IDE :一个浏览器插件,用于记录用户在浏览器中的操作,记录成 Selenium 命令,便于快速创建测试用例。
    • Grid :一个 Web 服务器,采用 Java 语言开发,用于在多个主机上执行 WebDriver 任务。

# WebDriver

# 安装

  1. 安装 webdriver 。

    • 如果安装在本机,则需要安装 Chrome、Firefox 等浏览器,再安装对应版本的 webdriver 二进制文件。
    • 也可以在其它主机部署 Grid 服务器,然后在本机调用。
  2. 安装 Python 的第三方库作为客户端:pip install selenium

# 用法

  • 参考文档 (opens new window)

  • 例:在本机启动 webdriver 服务器

    from selenium import webdriver
    
    driver = webdriver.Chrome()   # 启动 webdriver 。这会创建一个 webdriver 子进程,它又会创建几个 Chrome 子进程
    driver.quit()                 # 终止 webdriver
    
  • 例:调用远程的 Grid 服务器

    from selenium import webdriver
    from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
    
    driver = webdriver.Remote(
        command_executor="http://10.0.0.1:4444",
        desired_capabilities=DesiredCapabilities.CHROME
    )
    
  • 例:浏览网页

    >>> driver.get('http://www.baidu.com')   # 让浏览器返回一个 URL
    >>> driver.name            # 获取浏览器的名称
    'chrome'
    >>> driver.current_url     # 获取当前网页的 URL
    'https://www.baidu.com/'
    >>> driver.title           # 获取当前网页的标题
    '百度一下,你就知道'
    >>> driver.page_source     # 获取当前网页的 HTML 内容
    '<html><head><meta http-equiv="Content-Type" content="text/html;charset=utf-8">...
    >>> driver.save_screenshot('1.png')      # 保存网页截图(即使调用 Grid ,也能保存到本机)
    True
    
  • 例:在网页输入信息

    >>> from selenium.webdriver.common.keys import Keys
    >>> e = driver.find_element_by_id('kw')   # 查找 HTML 中的元素
    >>> e.send_keys('hello')                  # 输入字符串
    >>> e.send_keys(Keys.RETURN)              # 输入一个键盘快捷键
    >>> e.click()
    
  • 例:切换浏览器的窗口

    >>> driver.current_window_handle        # 获取当前窗口的句柄
    'CDwindow-C88E17197FCFDE3459E9E81F7498A3EA'
    >>> windows = driver.window_handles     # 获取浏览器所有窗口的句柄,返回一个 list
    >>> driver.close()                      # 关闭当前窗口
    >>> driver.switch_to.window(windows[0]) # 切换窗口
    
    • 浏览器可以打开多个窗口,而 driver 同时只能操纵一个窗口。

# Grid

# 架构

  • Grid 包含以下组件:

    • Node
      • :负责执行 WebDriver 任务。
      • 默认会自动发现本机上可用的 WebDriver ,注册到 Distributor 。
      • 每个 Node 提供了一定数量的 slot ,用于执行客户端 session 的任务。
    • Hub :包含以下组件:
      • Router
        • :作为 Grid 的入口,负责将客户端请求转发到对应的组件。
        • 例如收到客户端请求时,如果属于已有会话,则转发到 Session Map ,否则转发到 New Session Queue 。
      • Distributor
        • 负责为每个新的会话分配 Node 来执行任务。
      • Session Map
        • 负责记录每个 Session ID ,与执行该 Session 任务的 Node 的对应关系。
      • New Session Queue
      • Event Bus
        • 负责实现 Grid 各组件之间的通信。
  • Grid 可以部署成分布式集群,也可以以 Standalone 模式部署单节点。

# 部署

  • 可以下载 jar 包,然后运行:

    java -jar selenium-server.jar
    
  • 或者用 docker-compose 部署:

    version: '3'
    
    services:
    
      selenium:
        container_name: selenium
        image: selenium/standalone-chrome:131.0-20241204
        restart: unless-stopped
        shm_size: 2g
        ports:
          - 4444:4444
        # volumes:
        #   - ./config.toml:/opt/selenium/config.toml
    
    • 该 selenium 镜像会基于 supervisor 运行浏览器、webdriver、Grid 等多个进程。
    • 容器启动时总是会重新生成配置文件 config.toml ,除非没有写入权限。可以挂载 config.toml ,内容示例:
      [network]
      # relax-checks = true           # 是否放宽检查客户端 HTTP 请求的 Headers、Content-Type
      
      [node]
      # detect-drivers = true         # 是否自动发现本机上可用的 WebDriver
      # session-timeout = "300"       # 如果一个 session 超过 n 秒未活动,则删除该 session
      # max-sessions = 1              # 每个 node 允许同时运行的 session 数,默认等于 CPU 核数
      # override-max-sessions = false # 是否允许设置的 max-sessions 超过 CPU 核数
      # drain-after-session-coun = 0  # 执行 n 个 session 之后,清空并关闭该 node ,这适合 k8s 的部署模式
      
      [router]
      username = admin                # 给网站开启 Basic Auth 认证
      password = ******
      
      # [server]
      # port = 4444
      
    • 除了修改 config.toml 文件,也可添加环境变量来配置 selenium :
      SE_NODE_SESSION_TIMEOUT: '70'
      SE_NODE_MAX_SESSIONS: '4'
      SE_NODE_OVERRIDE_MAX_SESSIONS: 'true'