🚄 获取页面信息
成功访问网页后,可使用SessionPage
自身属性和方法获取页面信息。
from DrissionPage import SessionPage
page = SessionPage()
page.get('http://www.baidu.com')
# 获取页面标题
print(page.title)
# 获取页面html
print(page.html)
输出:
百度一下,你就知道
<!DOCTYPE html>
<!--STATUS OK--><html> <head><meta http-equi...
✅️️ 页面信息
📌 url
此属性返回当前访问的 url。
类型:str
📌 url_available
此属性以布尔值返回当前链接是否可用。
类型:bool
📌 title
此属性返回当前页面title
文本。
类型:str
📌 raw_data
此属性返回访问到的元素数据,即Response
对象的content
属性。
类型:bytes
📌 html
此属性返回当前页面 html 文本。
类型:str
📌 json
此属性把返回内容解析成 json。
比如请求接口时,若返回内容是 json 格式,用html
属性获取的话会得到一个字符串,用此属性获取可将其解析成dict
。
支持访问 *.json
文件,也支持 API 返回的json字符串。
类型:dict
📌 user_agent
此属性返回当前页面 user_agent 信息。
类型:str
✅️️ 运行参数信息
📌 timeout
此属性返回网络请求超时时间。默认为 10,可对其赋值设置。
类型:int
、float
# 创建页面对象时指定
page = SessionPage(timeout=5)
# 修改 timeout
page.timeout = 20
📌 retry_times
此属性为网络连接失败时的重试次数。默认为 3,可对其赋值。
类型:int
# 修改重试次数
page.retry_times = 5
📌 retry_interval
此属性为网络连接失败时的重试等待间隔秒数。默认为 2,可对其赋值。
类型:int
、float
# 修改重试等待间隔时间
page.retry_interval = 1.5
📌 encoding
此属性返回用户主动设置的编码格式。