跳到主要内容

🛩️ 获取页面信息


成功访问网页后,可使用SessionPage对象自身属性和方法获取页面信息。

from DrissionPage import SessionPage

page = SessionPage()
page.get('http://www.baidu.com')
# 获取页面标题
print(page.title)
# 获取页面html
print(page.html)

输出:

百度一下,你就知道
<!DOCTYPE html>
<!--STATUS OK--><html> <head><meta http-equi...

✅️️ 页面信息

📌 url

此属性返回当前访问的 url。

类型:str


📌 url_available

此属性以布尔值返回当前链接是否可用。

类型:bool


📌 title

此属性返回当前页面title文本。

类型:str


📌 raw_data

此属性返回访问到的元素数据,即Response对象的content属性。

类型:bytes


📌 html

此属性返回当前页面 html 文本。

类型:str


📌 json

此属性把返回内容解析成 json。
比如请求接口时,若返回内容是 json 格式,用html属性获取的话会得到一个字符串,用此属性获取可将其解析成dict。 支持访问 *.json 文件,也支持 API 返回的json字符串。

类型:dict


📌 user_agent

此属性返回当前页面 user_agent 信息。

类型:str


✅️️ 运行参数信息

📌 timeout

此属性返回网络请求超时时间,默认为 10 秒。

类型:intfloat


📌 retry_times

此属性为网络连接失败时的重试次数,默认为3

类型:int


📌 retry_interval

此属性为网络连接失败时的重试等待间隔秒数,默认为2

类型:intfloat


📌 encoding

此属性返回用户主动设置的编码格式。


✅️️ cookies 信息

📌 cookies()

此方法返回 cookies 信息。

类型:dictlist

参数名称类型默认值说明
all_domainsboolFalse是否返回所有 cookies,为False只返回当前 url 的
all_infoboolFalse返回的 cookies 是否包含所有信息,False时只包含namevaluedomain信息
返回类型说明
CookiesListcookies 组成的列表

cookies()方法返回的列表可转换为其它指定格式。

  • cookies().as_str()'name1=value1; name2=value2'格式的字符串
  • cookies().as_dict(){name1: value1, name2: value2}格式的字典
  • cookies().as_json():json 格式的字符串
说明

as_str()as_dict()都只会保留'name''value'字段。

示例:

from DrissionPage import SessionPage

page = SessionPage()
page.get('http://www.baidu.com')
page.get('http://gitee.com')

for i in page.cookies(all_domains=True):
print(i)

输出:

{'name': 'BDORZ', 'value': '27875', 'domain': '.baidu.com'}
{'name': 'BEC', 'value': '1f1759dfh65j65j5j4feb0357', 'domain': 'gitee.com'}

✅️️ 内嵌对象

📌 session

此属性返回当前页面对象使用的Session对象。

类型:Session


📌 response

此属性为请求网页后生成的Response对象,本库没实现的功能可直接获取此属性调用 requests 库的原生功能。

类型:Response

# 打印连接状态
r = page.response
print(r.status_code)