用 Python 爬了猫眼3000+《指环王》影评
指环王三部曲,可以说是魔幻电影的开山鼻祖,二十年前的特效下,森林、大山、魔王、高塔,城堡等等都栩栩如生的呈现在我们眼前。虽然这次重映,票房不高,也因为电影时长等原因被各种诟病,但是还是不影响魔戒迷们冲进电影院,来弥补二十年的遗憾!
本文获取了猫眼上三部曲的全部影评,一起来看看大陆影迷对于这系列“老”片的评价吧
数据获取
我们先来看看爬取数据的部分代码,由于猫眼采取了一定的反爬措施,一个比较重的措施就是对于请求中 header 的 UA 数值的校验,所以我们这里使用了 Python 第三方库中比较好用的生成随机 UA 的库 fake_useragent
from fake_useragent import UserAgentua = UserAgent()
接下来我们就可以根据评论的接口来获取数据了
def fire(num):
page = 0
for i in range(15, 135, 15):
print("开始爬取第 %s 页" % page)
headers["User-Agent"] = ua.random
url1 = 'http://m.maoyan.com/review/v2/comments.json?movieId=1220&offset={}&limit=15&type=2'.format(
i) # rings 1
url2 = 'http://m.maoyan.com/review/v2/comments.json?movieId=1221&offset={}&limit=15&type=2
用 Python 爬了猫眼3000+《指环王》影评相关推荐
- 用 Python 爬了猫眼3000+《指环王》影评,看看20年前的魔幻电影鼻祖在当下影迷眼中的样子...
指环王三部曲,可以说是魔幻电影的开山鼻祖,二十年前的特效下,森林.大山.魔王.高塔,城堡等等都栩栩如生的呈现在我们眼前.虽然这次重映,票房不高,也因为电影时长等原因被各种诟病,但是还是不影响魔戒迷们冲 ...
- python爬取电影评分_用Python爬取猫眼上的top100评分电影
代码如下: # 注意encoding = 'utf-8'和ensure_ascii = False,不写的话不能输出汉字 import requests from requests.exception ...
- python实战(一)Python爬取猫眼评分排行前100电影及简单数据分析可视化python实战(一)Python爬取猫眼排行前一百电影及简单数据分析可视化
python实战(一)Python爬取猫眼排行前一百电影及简单数据分析可视化 一.抓取数据 需要的库 request库 响应http请求 json库 将文本保存成json形式 pyquery 类似JQ ...
- python实战(一)Python爬取猫眼评分排行前100电影及简单数据分析可视化
python实战(一)Python爬取猫眼排行前一百电影及简单数据分析可视化 一.抓取数据 需要的库 request库 响应http请求 json库 将文本保存成json形式 pyquery 类似JQ ...
- (伪)Python爬取猫眼电影(反反爬虫过程中遇到的坑)
Python爬取猫眼电影 1.打开一个猫眼电影的URL,例如本月的较火的电影<毒液:致命守护者>http://maoyan.com/films/42964 直接F12,查看审核元素,发现上 ...
- python爬取猫眼电影数据
每天一点点,记录学习每一步 近期爬虫项目: 1:python 爬取菜鸟教程python100题,百度贴吧图片反爬虫下载,批量下载 2:python爬虫爬取百度贴吧图片,requests方法 3:pyt ...
- python猫眼电影分析_用Python 爬取猫眼电影数据分析《无名之辈》
前言 作者: 罗昭成 PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 http://note.youdao.com/noteshare?id=3054cce4add8a909e7 ...
- 利用python爬取猫眼电影,分析《大侦探皮卡丘》|凹凸数读
利用python爬取猫眼电影,分析<大侦探皮卡丘>,看看当皮卡丘长出绒毛,"丑拒"还是"真香"都在猫眼短评里了. 本文首发于微信公众号<凹凸数 ...
- Python爬取猫眼电影TOP100榜
Python爬取猫眼电影TOP100榜 兴趣点: 这个没什么特别的兴趣,只是单纯爬猫眼练手的人太多了,所以我也打算加入他们,对猫眼员工说一声不好意思了,哈哈哈! 爬取网址: 传送门:https://m ...
最新文章
- python能做回归吗_有大神会看Python多元回归的结果吗?本人做出来了,但是不会看.....
- python列拼接dataframe_如何将两个dataframe中的两列合并为新dataframe(pandas)的一列?...
- python自学行_怎么自学python?
- 443. 压缩字符串
- 字符数组拷贝与strcpy函数
- mysql dump 1017_MySQL数据库导出 - Can't Wait Any Longer - OSCHINA - 中文开源技术交流社区...
- 事务的隔离级别(Transaction isolation levels)5
- for循环多次调用cuda kernel函数_CUDA程序设计入门(二)——核函数
- Java MyBatis 占位符
- python怎么矩阵的秩_python – 从numpy或matlab中的满秩非矩形矩阵中获取可逆方阵...
- logback+slf4j作为日志系统
- 一个函数解决【LeetCode 买卖股票的最佳时机】系列所有题目!
- Python绘制计算机CPU占有率变化的折线图
- 使用requests爬取电影天堂数据,用lxml和Xpath
- Eclipse使用大全
- pytorch torchvision.models
- PT6303加充电电路的一套原理图
- style标签中的几个属性
- PMP证书好考吗?难度如何?
- 计算机组成原理----有关数据通路
热门文章
- SpringCloud Gateway打印请求、响应内容和唯一流水号配置
- 完整好用Dynasim.Dymola.v7.0动态系统仿真建模软件,广泛用在汽车,航空,航天等领域
- 日本空手道美女走红 堪称现实版春丽
- 智能语音标注工具小记
- Illustrator CS中字体丢失或缺失问题的解决方法
- Excel使用宏命令Excel取消超链接的方法
- 【实验三/四 面向对象程序设计/语言基础与面向对象】
- php libzip,基于PHP安装zip拓展,以及libzip安装的问题
- Flash开发环境简介
- 在 Ubuntu 下安装“魔灯”教学平台