跳到主要内容

🛰️ 连接浏览器


Chromium对象用于连接和管理浏览器。标签页的开关和获取、整体运行参数配置、浏览器信息获取等都由它进行。

根据不同的配置,可以接管已打开的浏览器,也可以启动新的浏览器。

每个浏览器只能有一个Chromium对象(同一进程中)。对同一个浏览器重复使用Chromium()获取的都是同一个对象。

Tips

程序结束时,被打开的浏览器不会主动关闭(VSCode 启动的除外),以便下次运行程序时使用。 新手在使用无头模式时需注意,程序关闭后其实浏览器进程还在,只是看不见。

✅️ Chromium初始化参数

初始化参数类型默认值说明
addr_or_optsstr
int
ChromiumOptions
None浏览器启动配置或接管信息。
传入 'ip: port' 字符串、端口数字或ChromiumOptions对象时按配置启动或接管浏览器;
None时使用配置文件配置启动浏览器
session_optionsSessionOptions
None
False
None使用双模 Tab 时使用的默认 Session 配置,为None使用 ini 文件配置,为False不从 ini 读取

✅️ 直接创建

📌 默认方式

这种方式代码最简洁,程序会使用默认配置,自动生成页面对象。

from DrissionPage import Chromium

browser = Chromium()

创建Chromium对象时会在指定端口启动浏览器,或接管该端口已有浏览器。

默认情况下,程序使用 9222 端口,浏览器可执行文件路径为'chrome'

如路径中没找到浏览器可执行文件,Windows 系统下程序会在注册表中查找路径。

如果都没找到,则要用下文介绍的手动配置方法。

直接创建时,程序默认读取 ini 文件配置,如 ini 文件不存在,会使用内置配置。

默认 ini 和内置配置信息详见“进阶使用->配置文件的使用”章节。

Tips

您可以修改配置文件中的配置,实现所有程序都按您的需要进行启动,详见”启动配置“章节。


📌 指定端口或地址

创建Chromium对象时向addr_or_opts参数传入端口号或地址,可接管指定端口浏览器,若端口空闲,使用默认配置在该端口启动一个浏览器。

传入端口时用int类型,传入地址时用'address:port'格式。

# 接管9333端口的浏览器,如该端口空闲,启动一个浏览器
browser = Chromium(9333)
browser = Chromium('127.0.0.1:9333')

✅️ 通过配置信息创建

如果需要已指定方式启动浏览器,可使用ChromiumOptions。它是专门用于设置浏览器初始状态的类,内置了常用的配置。详细使用方法见“浏览器启动配置”一节。

📌 使用方法

ChromiumOptions用于管理创建浏览器时的配置,内置了常用的配置,并能实现链式操作。详细使用方法见“启动配置”一节。

初始化参数类型默认值说明
read_fileboolTrue是否从 ini 文件中读取配置信息,如果为False则用默认配置创建
ini_pathstrNone文件路径,为None则读取默认 ini 文件
注意
  • 配置对象只有在启动浏览器时生效。
  • 浏览器创建后再修改这个配置是没有效果的。
  • 接管已打开的浏览器配置也不会生效。
# 导入 ChromiumOptions
from DrissionPage import Chromium, ChromiumOptions

# 创建浏览器配置对象,指定浏览器路径
co = ChromiumOptions().set_browser_path(r'D:\chrome.exe')
# 用该配置创建页面对象
browser = Chromium(addr_or_opts=co)

📌 使用指定 ini 文件创建

以上方法是使用默认 ini 文件中保存的配置信息创建对象,你可以保存一个 ini 文件到别的地方,并在创建对象时指定使用它。

from DrissionPage import Chromium, ChromiumOptions

# 创建配置对象时指定要读取的ini文件路径
co = ChromiumOptions(ini_path=r'./config1.ini')
# 使用该配置对象创建页面
browser = Chromium(addr_or_opts=co)

✅️ 接管已打开的浏览器

页面对象创建时,只要指定的地址(ip:port)已有浏览器在运行,就会直接接管。无论浏览器是下面哪种方式启动的。

📌 用程序启动的浏览器

默认情况下,创建浏览器页面对象时会自动启动一个浏览器。只要这个浏览器不关闭,下次运行程序时会接管同一个浏览器继续操作(配置的 ip:port 信息不变)。

这种方式极大地方便了程序的调试,使程序不必每次重新开始,可以单独调试某个功能。

from DrissionPage import Chromium

# 在9333端口启动浏览器同时创建对象,如果浏览器已经存在,则接管它
browser = Chromium(9333)

📌 手动打开的浏览器

如果需要手动打开浏览器再接管,可以这样做:

  1. 右键点击浏览器图标,选择属性
  2. 在“目标”路径后面加上 --remote-debugging-port=端口号(注意最前面有个空格)
  3. 点击确定
  4. 在程序中的浏览器配置中指定接管该端口浏览器

文件快捷方式的目标路径设置:

"D:\chrome.exe" --remote-debugging-port=9333

程序代码:

from DrissionPage import Chromium

browser = Chromium(9333)
注意

接管浏览器时只有local_portaddress参数是有效的。


📌 bat 文件启动的浏览器

可以把上一种方式的目标路径设置写进 bat 文件(Windows系统),运行 bat 文件来启动浏览器,再用程序接管。

新建一个文本文件,在里面输入以下内容(路径改为自己电脑的):

"D:\chrome.exe" --remote-debugging-port=9333

保存后把后缀改成 bat,然后双击运行就能在 9333 端口启动一个浏览器。程序代码则和上一个方法一致。


✅️ 多浏览器共存

如果想要同时操作多个浏览器,或者自己在使用其中一个上网,同时控制另外几个跑自动化,就需要给这些被程序控制的浏览器设置单独的 端口用户文件夹,否则会造成冲突。

📌 指定独立端口和数据文件夹

每个要启动的浏览器使用一个独立的ChromiumOptions对象进行设置:

from DrissionPage import Chromium, ChromiumOptions

# 创建多个配置对象,每个指定不同的端口号和用户文件夹路径
co1 = ChromiumOptions().set_paths(local_port=9111, user_data_path=r'D:\data1')
co2 = ChromiumOptions().set_paths(local_port=9222, user_data_path=r'D:\data2')

# 创建多个页面对象
tab1 = Chromium(addr_or_opts=co1).latest_tab
tab2 = Chromium(addr_or_opts=co2).latest_tab

# 每个页面对象控制一个浏览器
tab1.get('https://DrissionPage.cn')
tab2.get('https://www.baidu.com')
注意

每个浏览器都要设置独立的端口号和用户文件夹,二者缺一不可。


📌 auto_port()方法

ChromiumOptions对象的auto_port()方法,可以指定程序每次使用空闲的端口和临时用户文件夹创建浏览器。

使用auto_port()的配置对象可由多个Chromium对象共用,不会出现冲突。

这种方式创建的浏览器是全新不带任何数据的,并且运行数据会自动清除。

Tips

auto_port()支持多线程,多进程使用时由小概率出现端口冲突。
多进程使用时,可用scope参数指定每个进程使用的端口范围,以免发生冲突。

from DrissionPage import Chromium, ChromiumOptions

co = ChromiumOptions().auto_port()

tab1 = Chromium(addr_or_opts=co).latest_tab
tab2 = Chromium(addr_or_opts=co).latest_tab

tab2.get('https://DrissionPage.cn')
tab1.get('https://www.baidu.com')

📌 在 ini 文件设置自动分配

可以把自动分配的配置记录到 ini 文件,这样无需创建ChromiumOptions,每次启动的浏览器都是独立的,不会冲突。但和auto_port()一样,这些浏览器也不能复用。

from DrissionPage import ChromiumOptions

ChromiumOptions().auto_port(True).save()

这段代码把该配置记录到 ini 文件,只需运行一次,要关闭的话把参数换成False再执行一次即可。

from DrissionPage import Chromium

tab1 = Chromium().latest_tab
tab2 = Chromium().latest_tab

tab1.get('https://DrissionPage.cn')
tab2.get('https://www.baidu.com')

✅️ 使用系统浏览器用户目录

初始默认配置下,程序会为每个使用的端口创建空的用户目录,并且每次接管都使用,这样可以有效避免浏览器冲突。

有些时候我们希望使用系统安装的浏览器的默认用户文件夹。以便复用用户信息和插件等。

我们可以这样设置:

📌 使用ChromiumOptions

ChromiumOptions在每次启动时配置。

from DrissionPage import Chromium, ChromiumOptions

co = ChromiumOptions().use_system_user_path()
browser = Chromium(co)

📌 使用 ini 文件

把这个配置记录到 ini 文件,就不用每次使用都配置。

from DrissionPage import ChromiumOptions

ChromiumOptions().use_system_user_path().save()

✅️ 创建全新的浏览器

默认情况下,程序会复用之前用过的浏览器用户数据,因此可能带有登录数据、历史记录等。

如果想打开全新的浏览器,可用以下方法:

📌 使用auto_port()

上文提过的auto_port()方法,会自动查找一个空闲的端口启动全新的浏览器。

示例见上文。


📌 使用new_env()

ChromiumOptions对象的new_env()方法,可指定启动全新的浏览器。

如果指定端口已有浏览器,会自动关闭再启动新的。

from DrissionPage import Chromium, ChromiumOptions

co = ChromiumOptions().new_env()
browser = Chromium(co)

📌 手动指定端口和路径

给浏览器用户文件夹路径指定空的路径,以及指定一个空闲的端口,即可打开全新浏览器。

from DrissionPage import Chromium, ChromiumOptions

co = ChromiumOptions().set_local_port(9333).set_user_data_path(r'C:\tmp')
browser = Chromium(co)

✅️ 用户文件夹位置

复用用户文件夹可使用已登录的状态、已安装的插件、已设置好的配置等。

以下不同配置下用户文件夹的存放位置。

📌 默认配置

默认配置下,由 DrissionPage 创建的浏览器,用户文件夹在系统临时文件夹的DrissionPage\userData文件夹内,以端口命名。

假如用 DrissionPage 默认配置在 9222 端口创建一个浏览器,那么用户数据就存放在C:\Users\用户名\AppData\Local\Temp\DrissionPage\userData\9222路径。

这个用户文件夹不会主动清除,下次再使用 9222 端口时,会继续使用。

如果使用auto_port(),会存放在系统临时文件夹的DrissionPage\autoPortData文件夹内,以端口命名。

C:\Users\用户名\AppData\Local\Temp\DrissionPage\autoPortData\21489

这个用户文件夹是临时的,用完会被主动清除。


📌 自定义位置

如果要指定用户文件夹存放位置,可用ChromiumOptions对象的set_tmp_path()方法。

也可以保持到 ini 文件,可省略每次设置。

示例:

from DrissionPage import ChromiumOptions

ChromiumOptions().set_tmp_path(r'D:\tmp').save() # 保存到ini文件

📌 单独指定某个用户文件夹

指定用户文件夹路径,或使用系统文件夹路径,请查看上文。

from DrissionPage import Chromium, ChromiumOptions

co = ChromiumOptions().set_user_data_path(r'D:\tmp')
browser = Chromium(co)
from DrissionPage import Chromium, ChromiumOptions

co = ChromiumOptions().use_system_user_path()
browser = Chromium(co)