爬虫学习5——requests进阶(cookie登录、防盗链、
目录
cookies登录
方法一:在提出申请时指定cookie
方法二:使用session,给出登陆的网站和账户密码,后续使用session提出网站申请
防盗链:就是网站的溯源,当前本次请求的上一级是谁
cookies登录
登录之后会得到服务器返回的cookie,使用cookie请求我们需求的url页面
session用于保持登录信息,在这个过程中cookie信息不会丢失
session=requests.session()
方法一:在提出申请时指定cookie
import requestsresp=requests.get('https://user.17k.com/ck/author/shelf?page=1&appKey=2406394919',headers={'Cookie': 'GUID=db7d8a94-9836-49af-9d37-528c168c3c11; sajssdk_2015_cross_new_user=1; c_channel=0; c_csc=web; BAIDU_SSP_lcr=https://graph.qq.com/; Hm_lvt_9793f42b498361373512340937deb2a0=1646533275,1646542908,1646543120; accessToken=avatarUrl%3Dhttps%253A%252F%252Fcdn.static.17k.com%252Fuser%252Favatar%252F19%252F39%252F77%252F93477739.jpg-88x88%253Fv%253D1646548038000%26id%3D93477739%26nickname%3DTimmy666%26e%3D1662100809%26s%3D6dcc24a1c68aa6fd; sensorsdata2015jssdkcross=%7B%22distinct_id%22%3A%2293477739%22%2C%22%24device_id%22%3A%2217f5d07ebff14e-0fe76a06920b2b-56171d58-1296000-17f5d07ec00558%22%2C%22props%22%3A%7B%22%24latest_traffic_source_type%22%3A%22%E7%9B%B4%E6%8E%A5%E6%B5%81%E9%87%8F%22%2C%22%24latest_referrer%22%3A%22%22%2C%22%24latest_referrer_host%22%3A%22%22%2C%22%24latest_search_keyword%22%3A%22%E6%9C%AA%E5%8F%96%E5%88%B0%E5%80%BC_%E7%9B%B4%E6%8E%A5%E6%89%93%E5%BC%80%22%7D%2C%22first_id%22%3A%22db7d8a94-9836-49af-9d37-528c168c3c11%22%7D; Hm_lpvt_9793f42b498361373512340937deb2a0=1646549408'})
print(resp.json())
方法二:使用session,给出登陆的网站和账户密码,后续使用session提出网站申请
import requestssession=requests.session()url='https://user.17k.com/www/bookshelf/'data={'loginName':'17860069596','password':'qwerasdf123'}
session.post(url,data=data)resp=session.get('https://user.17k.com/ck/author/shelf?page=1&appKey=2406394919')
print(resp.json())
上述两种方法得到的结果相同
防盗链:就是网站的溯源,当前本次请求的上一级是谁
import requestsurl='https://www.pearvideo.com/video_1753355'contID=url.split('_')[1]videoStatusUrl=f'https://www.pearvideo.com/videoStatus.jsp?contId={contID}'headers={'Referer': 'https://www.pearvideo.com/video_1753355'}# Referer的值就是urlresp=requests.get(videoStatusUrl,headers=headers)dic=resp.json()srcUrl=dic['videoInfo']['videos']['srcUrl']
systemTime=dic['systemTime']srcUrl=srcUrl.replace(systemTime,f'cont-{contID}')img_resp=requests.get(srcUrl)
with open('F:/代码/pachong.mp4',mode='wb') as f:f.write(img_resp.content)#使用content拿到图片的字节,然后write
resp.close()
通过上面的代码我们就可以将短视频保存到本地名为pachong的一个本地视频
爬虫学习5——requests进阶(cookie登录、防盗链、相关推荐
- python爬虫requests.getcookie_爬虫14 案例--requests使用Cookie登录京东商城
京东测试账号: 账号:python_afu 密码:**** 手动登录京东后,保存头部信息 可以使用sublime对内容进行正则处理 注意如果有冒号,要去掉哦 下面的代码使用到了Cookie,因为Coo ...
- python爬虫--cookie、防盗链、代理
处理cookie 1.cookie就是在浏览器登录页面的时候,你把你的的账号和密码输入,主机会接受到你的用户名和密码,然后校验正确性,如果用户名和密码正确,主机会向你的浏览器里面的cookie里面写入 ...
- python妹子图爬虫5千张高清大图突破防盗链福利5千张福利高清大图
meizitu-spider python通用爬虫-绕过防盗链爬取妹子图 这是一只小巧方便,强大的爬虫,由python编写 所需的库有 requests BeautifulSoup os lxml 伪 ...
- 网络爬虫学习3 - Requests库的七个主要方法、安全性问题与异常处理、反爬虫和Robots协议
网络爬虫MOOC学习打卡 - 第三天 文章目录 网络爬虫MOOC学习打卡 - 第三天 一.Requests库主要方法解析 0.Requests库的七个主要方法 1.request()方法request ...
- 【python】【爬虫】selenium模块使用cookie登录
目录 使用Session对象获取cookies 使用selenium模块获取cookies实现自动登录 获取cookies 使用cookies自动登录 存在的问题 在以前的文章中实现了向服务器发送PO ...
- Python爬虫学习5:使用cookie访问网页(以豆瓣为例)
1. 先在浏览器上登录豆瓣,登录成功后打开开发者工具,可以查看到Cookie. 第一次登录后,短时间内再次打开此页面时,会发现系统已经保存了cookie, 不用再重新登录.时间长了cookie会失效, ...
- python爬虫学习笔记-requests基础
爬虫初始 为什么要学习爬虫 之前在授课过程中,好多同学都问过我这样的一个问题:为什么要学习爬虫,学习爬虫能够为我们以后的发展带来那些好处?其实学习爬虫的原因和为我们以后发展带来的好处都是显而易见的,无 ...
- python爬虫学习之淘宝模拟登录
使用教程 下载chrome浏览器 查看chrome浏览器的版本号,对应版本号的chromedriver驱动 pip安装下列包 pip install selenium 登录微博,并通过微博绑定淘宝账 ...
- python爬虫学习(一) requests模块
requests模块: python中原生的一款基于网络请求的模块,功能非常强大,简单便捷,效率极高.作用:模拟浏览器发请求. 如何使用:(requests模块的编码流程) 一指定url 一发起请求 ...
最新文章
- Linux下C++开发工具介绍
- python自学视频教程-28岁想从零开始自学python,有哪些靠谱免费的视频?
- 我的 FPGA 学习历程(11)—— 实验:按键消抖
- Spring Web 应用的最大败笔
- version control(版本控制)
- python自动化报表定时跑_POINTer分享:Python如何做报表自动化
- Jekins持续集成在ERP研发中的应用实践
- 【Linux网络编程学习】I/O多路复用——select和poll
- android list 替换元素_Python数据结构(一)List使用(大厂面试解答)
- dev调试时无法进入下一步_【问题解决方案】Dev C++ 无法调试的问题与解决
- 剑指offer(C++)-JZ18:删除链表的节点(数据结构-链表)
- 怎么保存php格式,把php代码保存到php文件实现方法
- MP4格式转换为AMV格式
- 十段均衡器开源 android,音频EQ(均衡器) - osc_1jvmu893的个人空间 - OSCHINA - 中文开源技术交流社区...
- intent传递集合数据
- python read_csv函数_Python pandas.read_csv()函数
- 服务器显示未知主机如何解决办法,mc服务器时候说我未知主机
- 百度人脸识别实现方法
- 关于地下管线探测技术发展的思考
- 自学类网站和实用工具(网文来自敖丙)
热门文章
- 如何通过华硕路由器官方自带功能实现远程FTP、远程观影、远程同步、远程访问登陆界面,有了IPV6,甚至可以买个域名再实现黑裙远程登录
- c语言文件资源,C语言文件操作
- 二阶RC锂电池模型simulink模型
- 跟随小米等手机厂商的 IoT 步伐,OPPO 推出子品牌“智美心品”...
- [回忆][职场]几个不愉快的求职经验,与我人生的奇遇
- Unreal 生成星空Skybox
- 车辆动力学模型推导注意细节(eg:科氏力的判断)
- 服务器snb芯片组,技嘉发布三款SNB Xeon单路服务器主板
- Windows上Emwin的使用
- Day651.NoSQL与RDBMS合理搭配问题 -Java业务开发常见错误