这里导入的包是用的这个https://blog.csdn.net/MR_HJY/article/details/81637745

from Day1.fengzhuang_all import get# url
url = 'http://www.renren.com/966927992'
# 构造headers
headers = {# 'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',# 'Accept-Encoding': 'gzip, deflate',# 'Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8',# 'Cache-Control': 'max-age=0',# 'Connection': 'keep-alive','Cookie': '***********',#根据自己的情况设置# 'Host': 'www.renren.com',# 'Referer': 'http://renren.com/',# 'Upgrade-Insecure-Requests': '1',# 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36',
}
# 调用get函数
html_bytes = get(url, headers=headers)# 保存页面
with open('renren.html','wb') as f:f.write(html_bytes)

由此代码可以看出,只有cookie也可以成功,因为里面包含了所需要的信息。

代码很简单,因为这是第一个版本,后面会在此基础上添加新的东西,和进行进一步的封装

爬虫--爬取人人网案列(一)相关推荐

  1. 对爬虫爬取到的数据进行存储

    已写章节 第一章 网络爬虫入门 第二章 基本库的使用 第三章 解析库的使用 第四章 数据存储 第五章 动态网页的抓取 文章目录 已写章节 第四章 数据存储 4.1 文件存储 4.1.1 TXT文件存储 ...

  2. python爬表格数据_python爬虫,爬取表格数据

    python爬虫,爬取表格数据 python爬虫,爬取表格数据 python爬虫,爬取全国空气质量指数 编程环境:Jupyter Notebook 所要爬取的网页数据内容如下图 python爬虫代码及 ...

  3. 【爬虫】利用Python爬虫爬取小麦苗itpub博客的所有文章的连接地址并写入Excel中(2)...

    [爬虫]利用Python爬虫爬取小麦苗itpub博客的所有文章的连接地址并写入Excel中(2) 第一篇( http://blog.itpub.net/26736162/viewspace-22865 ...

  4. python爬虫——爬取搜狗影视热门电视剧

    python爬虫--爬取搜狗影视热门电视剧 1.结果图 2.这次爬取的网址请点击传送门 搜狗影视热门电视剧 3.先构建请求头,请求头直接复制过来 4.接下来先请求这条url,通过format方法实现对 ...

  5. JAVA写的网页爬虫爬取必应词典的词汇音标

    为了建立一个英语词汇音标库,需要从网上搜索词汇音标,由于有10万多个词汇需要处理,所以做个这个单词音标爬虫爬取必应网络词典网页上的单词音标. package bingword;import java. ...

  6. [python爬虫]爬取天气网全国所有县市的天气数据

    [python爬虫]爬取天气网全国所有县市的天气数据 访问URL 解析数据 保存数据 所要用到的库 import requests from lxml import etree import xlwt ...

  7. 爬虫爬取京东商品详细数据 (品牌、售价、各类评论量(精确数量)、热评词及数量等)json解析部分数据

    文章目录 前言 一.数据保存格式设置及数据库准备(CentOS云mysql数据库) 1.分析数据需求(单一商品为例) 2.数据库保存格式 3.用到的数据库操作及指令 二.网页分析 1.分析网页源码,确 ...

  8. python制作爬虫爬取京东商品评论教程

    python制作爬虫爬取京东商品评论教程 作者:蓝鲸 类型:转载 本文是继前2篇Python爬虫系列文章的后续篇,给大家介绍的是如何使用Python爬取京东商品评论信息的方法,并根据数据绘制成各种统计 ...

  9. Python爬虫爬取知乎用户信息+寻找潜在客户

    [Python应用]寻找社交网络中的目标用户 日后的更新:由于是很久以前的课程设计项目,完整的源码已经不见了,关键的网页数据获取和解析的部分代码我在文章中已经贴出来了,但写的也不够好,如果想参考爬取知 ...

  10. python网络爬虫_Python网络爬虫——爬取视频网站源视频!

    原标题:Python网络爬虫--爬取视频网站源视频! 学习前提 1.了解python基础语法 2.了解re.selenium.BeautifulSoup.os.requests等python第三方库 ...

最新文章

  1. python由列表中提取出来的浮点型字符串不能直接转换成整形
  2. Galera Cluster for MySQL 集群恢复
  3. Cisco 综合交换实验Dynamips.Net实现方法
  4. mysql 毫秒比较_MYSQL的毫秒级时间比较问题
  5. 终于有人把AI、BI、大数据、数据科学讲明白了
  6. MyEclipse + Tomcat + Eclipse 开发调试WEB应用
  7. 低秩矩阵完备_矩阵之芯 SVD: 基本应用以及与其他分解的关系
  8. 【转】如何防止softmax函数上溢出(overflow)和下溢出(underflow)
  9. Android viewpager + fragment实现fragment之间的切换
  10. 雾里看花之 Python Asyncio
  11. OpenShift Origin 疑难杂症
  12. 计算机论文指导记录怎么写,毕业论文指导记录怎么写
  13. 24个足以改变事业的商业妙想
  14. 基于DLP4500的结构光3DScan应用手册
  15. 计算机基础必修上课是上机吗,关于大学计算机基础论文范文集,与上海财经大学国际工商管理学院相关毕业论文范文...
  16. HTML基础-综合案例1-学生信息表
  17. (java)跳台阶:一只青蛙一次可以跳上1级台阶,也可以跳上2级。求该青蛙跳上一个n级的台阶总共有多少种跳法(先后次序不同算不同的结果)。
  18. 博客导航——一站式搜索(所有博客的汇总帖)
  19. 目标检测入门知识以思考(写于2021.11)
  20. 苹果电脑登不上苹果商店_附近没有苹果商店? 尝试苹果授权服务提供商

热门文章

  1. 分布式系统的容错性(一)——容错性简介
  2. pandas计算环比与同比
  3. CVPR2004/风格分解:Separating Style and Content on a Nonlinear Manifold在非线性流形上分离样式和内容
  4. java代码实现简单的向企业微信发送信息
  5. CTF-MISC基础-压缩包隐写总结
  6. 【观察】嵌入式AI崛起,这里有一本通关“秘籍”
  7. oracle自增序列带字母,[原创]Oracle自增序列
  8. 【网络】Select服务器的实现
  9. Simhash算法介绍和应用内容
  10. R语言--异常值检测