最近刷抖音,刷到一部抄袭《X战警》电影海报的电影。 连电影海报都需要抄袭,这得是什么烂片!

尝试百度了一下,果然让人哭笑不得,连雷神的麒麟臂都一起抄了。

《女娲日记》绝对刷新你的认识

看了一下它的豆瓣评分,竟然是2分。

纵横观影界那么多年,看到的至少也是3分起步的电影,现在居然还有2分的电影

豆瓣评分最低打一星,换算成分数就是2分,因此豆瓣电影理论上的最低分不是0分,而是2分。

看来豆瓣对于某些电影还是挺照顾的。

感兴趣的朋友可以去看下这部电影,感受下吐槽的乐趣。

好了,进入搬砖模式,今天就来爬取下豆瓣评分在3分一下的那些神片,看看有没有你踩过的坑!

1

数 据 爬 取

| 页面分析

由于页面单次并不显示所有的电影信息,加载电影是URL也没有任何变化。 需要进一步研究页面,找出真实需要爬取的URL信息。

通过该URL可以发现该页面电影的详细信息:

|   数据抓取

通过点击加载更多,可以发现一些 规律:

真实URL中参数start会每次增加20,新的URL中呢也会相应的存储对应的20部电影的信息。

掌握这些规律之后,就可以用代码实现抓取了。

for i in range(0,481,20):url = "https://movie.douban.com/j/new_search_subjects?sort=T&range=0,10&tags=%E7%94%B5%E5%BD%B1&start={页面}&genres=%E5%89%A7%E6%83%85&countries=%E7%BE%8E%E5%9B%BD".format(页面 = i)data = requests.get(url,headers = headers).textdicts = json.loads(data)df = pd.DataFrame(dicts["data"])if i == 0:total_df = dfelse:total_df = pd.concat([total_df,df],axis = 0)

然后将爬取好的电影数据存入文件即可完成。后台回复  豆瓣电影  即可获取。

2

数 据 概 况

爬取数据时爬取了所有的低分电影,但是电影基本集中在2000年往后,2000年之前的电影基本没有低于3分的电影,可能因为这部分电影在这之前的评分方式不一致。 根据标签爬取的低评分(评分在2-3区间内)电影总量在550部左右。

电影名称,评分情况,电影信息和演职人员等信息截图如下:

这里面评分人数最多的是一部国产片《天机·富春山居图》,孙健君导演、刘德华和志玲姐姐的作品,很不幸地看过这部电影,emmm......一言难尽。

金扫帚奖-最令人失望的影片也是实至名归,非常好的烂片!

3

低 分 电 影 分 析

|  最近十年烂片数量变化

最近十年烂片数量节节攀升(当然电影总量也在上升),18年数量比较少,可能是因为爬取得不够全,或者时间关系,部分电影还没有收录。 (19年数据不全,暂时未放进来)

如果看这几年的烂片数量占比的话,最近几年的烂片占比在上升,从烂片占比这一个指标来说,影片质量下降明显。

|  不同地区的烂片数量

在获取的500多部低评分电影中,最多的是中国的电影,其次是美国的电影,当然虽然这两个地方的低分电影多,并不能说明我们或者美国的电影质量不好。

如果我们去看美国所有电影的评分分布情况,虽然美国的烂片比较多,但是他们的总量电影也非常多,而且不同评分的电影数量分布基本上满足标准的良性正态分布的关系。

这一次爬取了足够多的的电影,这里暂时不过多地深入了。 下一次会出个严肃的电影质量分析,敬请期待哈。

|  烂片中不同电影类型分布

在获取到的这些低评分电影中,最多标签就是动作片、剧情和喜剧。

不会拍好作品的尬拍动作片

不知道叫什么标签的取个剧情片肯定错不了

打喜剧标签的主要是那些好声音之为你转身类综艺大电影

一把把镰刀挥向韭菜,疯狂收着智商税。

4

电 影 推 荐

评论人数较多的几部烂片如下,看看有没有你踩过的坑,反正我是看过排名第一的《天机·富春山居图》。 (因为这是截止到18年的数据,所以《上海堡垒》侥幸躲过一劫)

仔细看了下这几部电影的简介,第二部也是个神片,感兴趣的赶紧搜索看一下。

出于好奇搜了一下你们的女神,赵老师的几部电影,果然都很出色。

一瞬间,青春期的那几部电影吸引了眼球,现在回想起来还有点上头。

看过富春山居图,知道赵奕欢,看过这个榜单后整个人都不大好了,我简直是烂片收割机本人。

用Python盘点那些豆瓣评分低于3.0的奇葩电影相关推荐

  1. 强烈推荐 | 豆瓣评分高达9.0的数学纪录片,从历史的角度给孩子科普数学知识...

    在豆瓣上的评分高达9.0的 BBC 纪录片"数学的故事(The Story of Maths)"是小编非常喜欢的一部纪录片:脉络清晰,逻辑清楚,深入浅出,从历史的角度给孩子科普数学 ...

  2. python编程入门经典 评分-关于 Python 的经典入门书籍有哪些?

    很多人在问,学习Python读什么书,这其实是一个非常通用的问题,学习分为三种方式:看书.上课.培训,而读书学习是最实惠也是最高效的一种,下面我们推荐6本高分书籍给大家,希望大家学习愉快: 1.Pyt ...

  3. python爬虫之xpath和lxml应用—爬取豆瓣评分爬取

    python爬虫之豆瓣评分爬取 1 第一步 获取网页源码 2 第二步 获取电影信息 3 第三步 保存数据 4 综合 ''' 需求:爬取电影的名字 评分 引言 详情页的url,每一页都爬取并且把数据保存 ...

  4. 完全小白篇-用python爬取豆瓣电影影评

    完全小白篇-用python爬取豆瓣影评 打开豆瓣电影 随机电影的所有影评网页 跳转逻辑 分析影评内容获取方法 逐一正则提取影评 针对标签格式过于多样的处理 针对提出请求的频率的限制 存储方式(本次sq ...

  5. 盘点:2022年豆瓣评分8.0以上的计算机书籍有哪些?

    2022年已经结束 ,小编来盘点一下过去一年里出版的计算机图书里,有哪些计算机书籍是豆瓣评分8.0以上图书. 1.人工智能:现代方法(第4版)(上下册) ​ 系统性总结人工智能的方方面面,国际人工智能 ...

  6. 豆瓣评分8.0以上,2021年程序员新书大盘点

    今天是元旦,小编祝大家元旦快乐!多拿年终奖.今天带大家盘点一下2021年出版的程序员新书中豆瓣评分8.0以上的书.顺序是出版时间的倒序. 1.计算之魂 : 计算科学品位和认知进阶 豆瓣评分9.4 吴军 ...

  7. python编程入门经典 评分-豆瓣评分爆炸!Python+机器学习经典图书

    全场自营图书每满 100 减 50 元 .满 200 元减 100 元, 另外当当还特意为[机器学习算法与Python实战]读者提供了一批可与满减叠加使用的"满 200 减 40" ...

  8. python进阶书籍推荐-豆瓣评分9.4!年度最值得推荐的Python进阶书

    原标题:豆瓣评分9.4!年度最值得推荐的Python进阶书 来自:程序员书库(ID:OpenSourceTop) 编译 链接:https://whatpixel.com/fluent-python-b ...

  9. python编程快速上手 让繁琐工作自动化 豆瓣_2019年,这些豆瓣评分9.0以上的8本程序员好书你都知道吗?...

    豆瓣这些9.0以上的高评分程序员好书你都知道有哪些吗?小编去豆瓣看了一下,推荐这8本最适用的程序员好书给你. 1.UNIX环境高级编程(第3版)(豆瓣评分9.6)UNIX编程圣经 与Linux相结合的 ...

最新文章

  1. c 将图片存入到mysql数据库中_如何将图片转换存入到数据库中,并从数据库中取出转换成图片...
  2. 深度学习用于基于内容的图像检索 Deep Learning for Content-Based Image Retrieval
  3. 单选按钮步骤流程向导 js_创建令人愉快的按钮的6个步骤
  4. 老司机实战Windows Server Docker:4 单节点Windows Docker服务器简单运维(下)
  5. 硬件测试含软件调试,硬件调试与测试规范.doc
  6. 【SpringCloud】Spring cloud Alibaba Sentinel 系统规则
  7. 新版 Windows 10 最佳功能预览,五月即将更新
  8. 年底了,到底要不要跳槽?
  9. 数据结构考研:随机存取、顺序存取、随机存储和顺序存储的区别/详细解释(计算机/软件工程/王道论坛)
  10. FusionChartsFree例子
  11. H.265编码原理入门
  12. 【LDC1314】电感传感器中文手册与检测原理介绍
  13. 《跟开涛学SpringMVC》学习笔记
  14. html战旗游戏,战棋页游-策略类战棋网页游戏推荐
  15. TI Sitara系列AM64x核心板(双核ARM Cortex-A53)软硬件规格资料
  16. 我想成为一只IT小小鸟
  17. 为什么梦里常有视觉和听觉,却没有痛觉和嗅觉?
  18. LED背光源运用在温控设备上
  19. 【JavaScript】JS校验MAC地址
  20. (4)tiny4412移植uboot_2018_07

热门文章

  1. python-标识符与变量-标识符的命名规范
  2. Mysql 加锁防并发
  3. 干货篇:创业对待数据挖掘要注意这5点
  4. correlated subquery and non-correlated subquery
  5. uniGUI试用笔记(四)
  6. nginx反向代理初探
  7. Træfɪk入门教程
  8. 容器编排技术 -- Kubernetes kubectl rollout undo 命令详解
  9. C语言,利用数组编写程序输入30个数,分别统计正整数,0,负数个数,并求和
  10. Linux debian 查看CPU温度