跳到主要内容

🔖 采集链接


本示例以 DrissionPage文档网页 为例演示如何采集链接。

✅️ 任务分析

假设我们需要把文档左边的链接采集到 xlsx 文件,并生成可点击打开的链接。

从 F12 中可看到,所有链接的class参数都以'menu__link'开头。

所以可以用'.^menu__link'作为筛选条件遍历所有链接元素,获取文本和链接。

然后用Recorderadd_data()方法添加到文件。

add_data()不能直接添加链接,需要与add_link()配合。

由于新增一条数据后,这条数据就是最后一条,所以add_link()定位到-1行就可指向最后一条数据。


✅️ 完整代码

from DrissionPage import Chromium
from DrissionRecord import Recorder

r = Recorder('data.xlsx') # 创建记录器对象
r.set.link_style() # 启用内置链接样式
t = Chromium().latest_tab
t.get('https://drissionpage.cn/browser_control/intro/')
for a in t.eles('.^menu__link'): # 遍历所有栏目
r.add_data({'栏目': a.text, 'url': a.link}) # 添加数据
r.add_link(a.link, f'B-1') # 添加链接到倒数第一个数据的B列
r.record()

✅️ 执行效果