目标网址

https://mp.csdn.net/postlist

一,请求头带上cookie数据

先写一个模块

spidertool.py

# 爬虫的请求处理模块def trans_head_2_dict(head):"""接收字符串,转换为字典"""res = dict()head_list = head.split(":")res[head_list[0]] = head_list[1].strip()return res
import requests
import spidertool# 请求网址
url = "https://mp.csdn.net/postlist"# UA
ua_str = """user-agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36"""
ua_dict = spidertool.trans_head_2_dict(ua_str)
# cookie
cookie_str =  自己cookie
cookie_dict = spidertool.trans_head_2_dict(cookie_str)
# headers
headers ={}
headers.update(cookie_dict)
headers.update(ua_dict)
print(headers)# 发起请求
res = requests.get(url, headers = headers)
con = res.content.decode()with open('a.html', 'w', encoding='utf8') as f:f.write(con)

爬虫-练习-爬取访问后可见的内容相关推荐

  1. 如何去使用Python爬虫来爬取B站的弹幕数据?

    哔哩哔哩众所周知是弹幕的天堂,视频观看人数越多,弹幕也就越多.今天小千就来教大家如何去使用Python开发一个爬虫来爬取B站的弹幕数据. 1.弹幕哪里找? 平常我们在看视频时,弹幕是出现在视频上的.实 ...

  2. [python爬虫] Selenium爬取内容并存储至MySQL数据库

    前面我通过一篇文章讲述了如何爬取CSDN的博客摘要等信息.通常,在使用Selenium爬虫爬取数据后,需要存储在TXT文本中,但是这是很难进行数据处理和数据分析的.这篇文章主要讲述通过Selenium ...

  3. python爬取豆瓣电影top250_Python爬虫 - scrapy - 爬取豆瓣电影TOP250

    0.前言 新接触爬虫,经过一段时间的实践,写了几个简单爬虫,爬取豆瓣电影的爬虫例子网上有很多,但都很简单,大部分只介绍了请求页面和解析部分,对于新手而言,我希望能够有一个比较全面的实例.所以找了很多实 ...

  4. Python爬虫实战爬取租房网站2w+数据-链家上海区域信息(超详细)

    Python爬虫实战爬取租房网站-链家上海区域信息(过程超详细) 内容可能有点啰嗦 大佬们请见谅 后面会贴代码 带火们有需求的话就用吧 正好这几天做的实验报告就直接拿过来了,我想后面应该会有人用的到吧 ...

  5. lofter 爬虫_Python网络爬虫1 - 爬取网易LOFTER图片

    LOFTER是网易出品的优质轻博客,灵感源于国外的tumblr,但比之更加文艺,更加本地化.本人非常喜欢LOFTER的UI设计,以及其中的优质用户和内容,似乎网易并不擅长推广,所以受众并不广泛.这都是 ...

  6. 爬虫之爬取易班推文信息

    简介 趁着周末有空,最近又在做爬虫相关的功能,想将易班的推文信息放到自己的小程序里,奈何网上没有找到合适的文章,于是就自己研究了一下易班推文的爬取,使用Springboot设置定时任务去爬取,在爬取信 ...

  7. python爬虫实战---爬取大众点评评论

    python爬虫实战-爬取大众点评评论(加密字体) 1.首先打开一个店铺找到评论 很多人学习python,不知道从何学起. 很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手. 很多 ...

  8. python爬虫之爬取网页基础知识及环境配置概括

    记:python爬虫是爬取网页数据.统计数据必备的知识体系,当我们想统计某个网页的部分数据时,就需要python爬虫进行网络数据的爬取,英文翻译为 spider 爬虫的核心 1.爬取网页:爬取整个网页 ...

  9. Python爬虫可以爬取什么呢?

    Python_Python爬虫可以爬取什么 如果你仔细观察,就不难发现,懂爬虫.学习爬虫的人越来越多, 一方面,互联网可以获取的数据越来越多, 另一方面,像 Python这样的编程语言提供越来越多的优 ...

最新文章

  1. 有名内部类 匿名内部类
  2. 2018汇总数据结构算法篇
  3. mysql重装远程服务未_MySQL远程连接丢失问题解决方法(Lost connection to MySQL server)...
  4. jQuery入门第三天
  5. stm32可以移植linux系统吗,如何在STM32上移植Linux?超详细的实操经验分享
  6. 玩微博也好,头条、朋友圈也罢
  7. OpenSuSE 网络配置
  8. LeNet网络分类MINST数据集,附详细代码及注解和B站视频讲解
  9. 维修电工技师、高级技师技能实训考核装置
  10. PV-RCNN:Point-based与Voexl-based共同成就的高性能3D目标检测网络
  11. 傅里叶变换和小波变换:时间序列异常检测
  12. freeswitch配置软电话
  13. word 文档如何加密
  14. php写入文件内容方法,学习php写入文件内容的方法
  15. oppok3如何刷机_[oppok3刷机教程]oppok3怎么刷机
  16. 人工智能数学课高等数学线性微积分数学教程笔记(1. 数学内容概述)
  17. wps 云文档的服务器地址,在WPS云文档保存、管理文件
  18. 测控技术与仪器应该学计算机哪些,测控技术与仪器专业到底学到了什么?
  19. BypassUAC方式总结
  20. 计算机右击加设备管理器,win10系统计算机右键菜单添加设备管理器的还原步骤...

热门文章

  1. Linux查看:crontab开启状态
  2. layui入门基础:资源汇总
  3. 简述linux虚拟内存的概念,Linux进程虚拟内存中的相关概念
  4. 用深度强化学习玩atari游戏_被追捧为“圣杯”的深度强化学习已走进死胡同
  5. careyshop-商城框架系统
  6. 骏飞H5幸运刮刮乐源码
  7. css图片自适应 有缝隙,有间隙,解决办法
  8. vue数据改变了,视图不更新不刷新问题
  9. 去掉input、textarea 的边框
  10. 唯美动态个人404单页HTML源码