🔖 采集链接
本示例以 DrissionPage文档网页 为例演示如何采集链接。
✅️ 任务分析
假设我们需要把文档左边的链接采集到 xlsx 文件,并生成可点击打开的链接。
从 F12 中可看到,所有链接的class
参数都以'menu__link'
开头。
所以可以用'.^menu__link'
作为筛选条件遍历所有链接元素,获取文本和链接。
然后用Recorder
的add_data()
方法添加到文件。
但add_data()
不能直接添加链接,需要与add_link()
配合。
由于新增一条数据后,这条数据就是最后一条,所以add_link()
定位到-1
行就可指向最后一条数据。
✅️ 完整代码
from DrissionPage import Chromium
from DrissionRecord import Recorder
r = Recorder('data.xlsx') # 创建记录器对象
r.set.link_style() # 启用内置链接样式
t = Chromium().latest_tab
t.get('https://drissionpage.cn/browser_control/intro/')
for a in t.eles('.^menu__link'): # 遍历所有栏目
r.add_data({'栏目': a.text, 'url': a.link}) # 添加数据
r.add_link(a.link, f'B-1') # 添加链接到倒数第一个数据的B列
r.record()