目录

cookies登录

方法一:在提出申请时指定cookie

方法二:使用session,给出登陆的网站和账户密码,后续使用session提出网站申请

防盗链:就是网站的溯源,当前本次请求的上一级是谁


cookies登录

登录之后会得到服务器返回的cookie,使用cookie请求我们需求的url页面

session用于保持登录信息,在这个过程中cookie信息不会丢失

session=requests.session()

方法一:在提出申请时指定cookie

import requestsresp=requests.get('https://user.17k.com/ck/author/shelf?page=1&appKey=2406394919',headers={'Cookie': 'GUID=db7d8a94-9836-49af-9d37-528c168c3c11; sajssdk_2015_cross_new_user=1; c_channel=0; c_csc=web; BAIDU_SSP_lcr=https://graph.qq.com/; Hm_lvt_9793f42b498361373512340937deb2a0=1646533275,1646542908,1646543120; accessToken=avatarUrl%3Dhttps%253A%252F%252Fcdn.static.17k.com%252Fuser%252Favatar%252F19%252F39%252F77%252F93477739.jpg-88x88%253Fv%253D1646548038000%26id%3D93477739%26nickname%3DTimmy666%26e%3D1662100809%26s%3D6dcc24a1c68aa6fd; sensorsdata2015jssdkcross=%7B%22distinct_id%22%3A%2293477739%22%2C%22%24device_id%22%3A%2217f5d07ebff14e-0fe76a06920b2b-56171d58-1296000-17f5d07ec00558%22%2C%22props%22%3A%7B%22%24latest_traffic_source_type%22%3A%22%E7%9B%B4%E6%8E%A5%E6%B5%81%E9%87%8F%22%2C%22%24latest_referrer%22%3A%22%22%2C%22%24latest_referrer_host%22%3A%22%22%2C%22%24latest_search_keyword%22%3A%22%E6%9C%AA%E5%8F%96%E5%88%B0%E5%80%BC_%E7%9B%B4%E6%8E%A5%E6%89%93%E5%BC%80%22%7D%2C%22first_id%22%3A%22db7d8a94-9836-49af-9d37-528c168c3c11%22%7D; Hm_lpvt_9793f42b498361373512340937deb2a0=1646549408'})
print(resp.json())

方法二:使用session,给出登陆的网站和账户密码,后续使用session提出网站申请

import requestssession=requests.session()url='https://user.17k.com/www/bookshelf/'data={'loginName':'17860069596','password':'qwerasdf123'}
session.post(url,data=data)resp=session.get('https://user.17k.com/ck/author/shelf?page=1&appKey=2406394919')
print(resp.json())

上述两种方法得到的结果相同 

防盗链:就是网站的溯源,当前本次请求的上一级是谁

import requestsurl='https://www.pearvideo.com/video_1753355'contID=url.split('_')[1]videoStatusUrl=f'https://www.pearvideo.com/videoStatus.jsp?contId={contID}'headers={'Referer': 'https://www.pearvideo.com/video_1753355'}# Referer的值就是urlresp=requests.get(videoStatusUrl,headers=headers)dic=resp.json()srcUrl=dic['videoInfo']['videos']['srcUrl']
systemTime=dic['systemTime']srcUrl=srcUrl.replace(systemTime,f'cont-{contID}')img_resp=requests.get(srcUrl)
with open('F:/代码/pachong.mp4',mode='wb') as f:f.write(img_resp.content)#使用content拿到图片的字节,然后write
resp.close()

通过上面的代码我们就可以将短视频保存到本地名为pachong的一个本地视频

爬虫学习5——requests进阶(cookie登录、防盗链、相关推荐

  1. python爬虫requests.getcookie_爬虫14 案例--requests使用Cookie登录京东商城

    京东测试账号: 账号:python_afu 密码:**** 手动登录京东后,保存头部信息 可以使用sublime对内容进行正则处理 注意如果有冒号,要去掉哦 下面的代码使用到了Cookie,因为Coo ...

  2. python爬虫--cookie、防盗链、代理

    处理cookie 1.cookie就是在浏览器登录页面的时候,你把你的的账号和密码输入,主机会接受到你的用户名和密码,然后校验正确性,如果用户名和密码正确,主机会向你的浏览器里面的cookie里面写入 ...

  3. python妹子图爬虫5千张高清大图突破防盗链福利5千张福利高清大图

    meizitu-spider python通用爬虫-绕过防盗链爬取妹子图 这是一只小巧方便,强大的爬虫,由python编写 所需的库有 requests BeautifulSoup os lxml 伪 ...

  4. 网络爬虫学习3 - Requests库的七个主要方法、安全性问题与异常处理、反爬虫和Robots协议

    网络爬虫MOOC学习打卡 - 第三天 文章目录 网络爬虫MOOC学习打卡 - 第三天 一.Requests库主要方法解析 0.Requests库的七个主要方法 1.request()方法request ...

  5. 【python】【爬虫】selenium模块使用cookie登录

    目录 使用Session对象获取cookies 使用selenium模块获取cookies实现自动登录 获取cookies 使用cookies自动登录 存在的问题 在以前的文章中实现了向服务器发送PO ...

  6. Python爬虫学习5:使用cookie访问网页(以豆瓣为例)

    1. 先在浏览器上登录豆瓣,登录成功后打开开发者工具,可以查看到Cookie. 第一次登录后,短时间内再次打开此页面时,会发现系统已经保存了cookie, 不用再重新登录.时间长了cookie会失效, ...

  7. python爬虫学习笔记-requests基础

    爬虫初始 为什么要学习爬虫 之前在授课过程中,好多同学都问过我这样的一个问题:为什么要学习爬虫,学习爬虫能够为我们以后的发展带来那些好处?其实学习爬虫的原因和为我们以后发展带来的好处都是显而易见的,无 ...

  8. python爬虫学习之淘宝模拟登录

    使用教程 下载chrome浏览器 查看chrome浏览器的版本号,对应版本号的chromedriver驱动 pip安装下列包  pip install selenium 登录微博,并通过微博绑定淘宝账 ...

  9. python爬虫学习(一) requests模块

    requests模块: python中原生的一款基于网络请求的模块,功能非常强大,简单便捷,效率极高.作用:模拟浏览器发请求. 如何使用:(requests模块的编码流程) 一指定url 一发起请求 ...

最新文章

  1. Linux下C++开发工具介绍
  2. python自学视频教程-28岁想从零开始自学python,有哪些靠谱免费的视频?
  3. 我的 FPGA 学习历程(11)—— 实验:按键消抖
  4. Spring Web 应用的最大败笔
  5. version control(版本控制)
  6. python自动化报表定时跑_POINTer分享:Python如何做报表自动化
  7. Jekins持续集成在ERP研发中的应用实践
  8. 【Linux网络编程学习】I/O多路复用——select和poll
  9. android list 替换元素_Python数据结构(一)List使用(大厂面试解答)
  10. dev调试时无法进入下一步_【问题解决方案】Dev C++ 无法调试的问题与解决
  11. 剑指offer(C++)-JZ18:删除链表的节点(数据结构-链表)
  12. 怎么保存php格式,把php代码保存到php文件实现方法
  13. MP4格式转换为AMV格式
  14. 十段均衡器开源 android,音频EQ(均衡器) - osc_1jvmu893的个人空间 - OSCHINA - 中文开源技术交流社区...
  15. intent传递集合数据
  16. python read_csv函数_Python pandas.read_csv()函数
  17. 服务器显示未知主机如何解决办法,mc服务器时候说我未知主机
  18. 百度人脸识别实现方法
  19. 关于地下管线探测技术发展的思考
  20. 自学类网站和实用工具(网文来自敖丙)

热门文章

  1. 如何通过华硕路由器官方自带功能实现远程FTP、远程观影、远程同步、远程访问登陆界面,有了IPV6,甚至可以买个域名再实现黑裙远程登录
  2. c语言文件资源,C语言文件操作
  3. 二阶RC锂电池模型simulink模型
  4. 跟随小米等手机厂商的 IoT 步伐,OPPO 推出子品牌“智美心品”...
  5. [回忆][职场]几个不愉快的求职经验,与我人生的奇遇
  6. Unreal 生成星空Skybox
  7. 车辆动力学模型推导注意细节(eg:科氏力的判断)
  8. 服务器snb芯片组,技嘉发布三款SNB Xeon单路服务器主板
  9. Windows上Emwin的使用
  10. Day651.NoSQL与RDBMS合理搭配问题 -Java业务开发常见错误