Chrome 浏览器的 ChromeOptions 参数介绍，selenium 动态渲染必看

背景

    在使用 selenium 浏览器渲染技术，爬取网站信息时，默认情况下就是一个普通的纯净的chrome浏览器，而我们平时在使用浏览器时，经常就添加一些插件，扩展，代理之类的应用。相对应的，当我们用chrome浏览器爬取网站时，可能需要对这个chrome做一些特殊的配置，以满足爬虫的行为。

  **  常用的行为有：**

禁止图片和视频的加载：提升网页加载速度。
添加代理：用于翻墙访问某些页面，或者应对IP访问频率限制的反爬技术。
使用移动头：访问移动端的站点，一般这种站点的反爬技术比较薄弱。
添加扩展：像正常使用浏览器一样的功能。
设置编码：应对中文站，防止乱码。
阻止JavaScript执行。

正文

1. chromeOptions 介绍

   chromeOptions 是一个配置 chrome 启动是属性的类，通过这个类，我们可以为chrome配置如下参数（这个部分可以通过selenium源码看到）：

设置 chrome 二进制文件位置 (binary_location)
添加启动参数 (add_argument)
添加扩展应用 (add_extension, add_encoded_extension)
添加实验性质的设置参数 (add_experimental_option)
设置调试器地址 (debugger_address)

2. chromeOptions 源码

class Options(object):

    def __init__(self):
        # 设置 chrome 二进制文件位置
        self._binary_location = ''
        # 添加启动参数
        self._arguments = []
        # 添加扩展应用
        self._extension_files = []
        self._extensions = []
        # 添加实验性质的设置参数
        self._experimental_options = {}
        # 设置调试器地址
        self._debugger_address = None

3. 使用案例

try:
    # 创建谷歌浏览器驱动参数对象
    chrome_options = webdriver.ChromeOptions()
    # 不加载图片
    prefs = {"profile.managed_default_content_settings.images": 2}
    chrome_options.add_experimental_option("prefs", prefs)
    # 使用headless无界面浏览器模式
    chrome_options.add_argument('--headless')
    chrome_options.add_argument('--disable-gpu')
    # chrome_options.binary_location = r'...\chrome.exe'

    # 加载谷歌浏览器驱动
    driver = webdriver.Chrome(r'...\chromedriver.exe')

    # 请求地址
    driver.get('https://item.jd.com/100038004369.html')
    wait = WebDriverWait(driver,10)    # 等待10秒
    # 等待页面加载class名称为m-item-inner的节点，该节点中包含商品信息
    wait.until(EC.presence_of_element_located((By.CLASS_NAME,"w")))

    # 退出浏览器驱动
    driver.quit()

except Exception as e:
    print(e)

4. 参数介绍

参数含义.add_argument('--disable-infobars') 禁止策略化.add_argument('--no-sandbox')解决DevToolsActivePort文件不存在的报错.add_argument('window-size=1920x3000')指定浏览器分辨率.add_argument('--disable-gpu')谷歌禁用GPU加速.add_argument('--disable-javascript')禁用javascript.add_argument('--incognito')隐身模式（无痕模式）.add_argument('--start-maximized')最大化运行（全屏窗口）,不设置，取元素会报错.add_argument('--hide-scrollbars')隐藏滚动条, 应对一些特殊页面.add_argument('blink-settings=imagesEnabled=false')不加载图片, 提升速度.add_argument('--headless')浏览器不提供可视化页面（无头模式）. linux下如果系统不支持可视化不加这条会启动失败.add_argument('disable-infobars')去掉Chrome提示受到自动软件控制.add_argument('lang=en_US')设置语言.add_argument('User-Agent=xxxxxx')设置User-Agent属性.add_argument('--kiosk-printing') 默认打印机进行打印.binary_location = r"...\chrome.exe"手动指定使用的浏览器位置.add_experimental_option("debuggerAddress", "127.0.0.1:9222") 调用原来的浏览器，不用再次登录即可重启
prefs = {"":""}

prefs["credentials_enable_service"] = False

prefs["profile.password_manager_enabled"] = False

.add_experimental_option("prefs", prefs)
设置prefs属性，屏蔽'保存密码'提示框.add_experimental_option('excludeSwitches', ['enable-automation'])以开发者模式启动调试chrome，可以去掉提示受到自动软件控制.add_experimental_option('useAutomationExtension', False) 去掉提示以开发者模式调用

标签： chrome chromeOptions selenium

本文转载自: https://blog.csdn.net/weixin_44259720/article/details/127095705
版权归原作者 Java Punk 所有，如有侵权，请联系我们删除。

Chrome 浏览器的 ChromeOptions 参数介绍，selenium 动态渲染必看

背景

正文

1. chromeOptions 介绍

2. chromeOptions 源码

3. 使用案例

4. 参数介绍

发表评论

“Chrome 浏览器的 ChromeOptions 参数介绍，selenium 动态渲染必看”的评论:

关于作者

overfit同步小助手

相关阅读

文章导航