前戏 有些页面需要登录才可以访问,而服务器是根据cookie来进行判断的,服务器拿到浏览器的cookie,然后再数据库里进行查询判断,如果校验通过,则服务器认为是登录过的,才有继续
前戏
有些页面需要登录才可以访问,而服务器是根据cookie来进行判断的,服务器拿到浏览器的cookie,然后再数据库里进行查询判断,如果校验通过,则服务器认为是登录过的,才有继续访问的权限,否则,服务器可能会返回到登录页面让你进行登录。
设置cookie
登录cookie = 登录后的cookies - 登录前的cookies
想发送你的cookies到服务器,可以使用 cookies 参数:
import requests url = ‘http://httpbin.org/cookies‘ cookies = dict(cookies_are=‘working‘) r = requests.get(url, cookies=cookies) print(r.text)
结果:
{ "cookies": { "cookies_are": "working" } }
Cookie 的返回对象为 RequestsCookieJar,它的行为和字典类似,但接口更为完整,适合跨域名跨路径使用。你还可以把 Cookie Jar 传到 Requests 中:
import requests jar = requests.cookies.RequestsCookieJar() jar.set(‘tasty_cookie‘, ‘yum‘, domain=‘httpbin.org‘, path=‘/cookies‘) jar.set(‘gross_cookie‘, ‘blech‘, domain=‘httpbin.org‘, path=‘/elsewhere‘) url = ‘http://httpbin.org/cookies‘ r = requests.get(url, cookies=jar) print(r.text)
结果:
{ "cookies": { "tasty_cookie": "yum" } }
如果某个响应中包含一些 cookie,你可以快速访问它们:
import requests url = ‘http://example.com/some/cookie/setting/url‘ r = requests.get(url) print(r.cookies[‘example_cookie_name‘])
实战
import requests # 先打开登录首页,获取部分cookie url = "https://passport.cnblogs.com/user/signin" headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64; rv:44.0) Gecko/20100101 Firefox/44.0" } r = requests.get(url, headers=headers, verify=False) print(r.cookies) # 添加前的cookies # 添加登录需要的两个cookie c = requests.cookies.RequestsCookieJar() c.set(‘.CNBlogsCookie‘, ‘xxx‘) # 填抓包内容 c.set(‘.Cnblogs.AspNetCore.Cookies‘, ‘xxx‘) # 填抓包内容 r.cookies.update(c) # 更新cookies print(r.cookies) # 添加后的cookies