python爬取《龙岭迷窟》的数据,看看质量剧情还原度到底怎么样
前言
文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。
作者:简单
PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取http://t.cn/A6Zvjdun
对于小说鬼吹灯,相信很多人都知道,它可谓是国内盗墓寻宝系列小说的巅峰之作,最近得知该系列小说的《龙岭迷窟》部分被制作成了网剧,已经于 4 月 1 日开播了,主要演员潘粤明、姜超、张雨绮等都是一些大家比较熟悉的面孔,网剧质量、剧情还原度等到底怎么样呢?我们通过本文来简单了解一下。
我们都知道要了解一件事情是需要用数据说话的,本文数据来源我们还是选择豆瓣的评论区数据吧
目前已经有3万6千多人参与了评分且打 4 星和 5 星的人数居多,总体评分 8.3,算是一个比较优秀的分数了。
接着我们将网页向下拉到短评位置,如下所示:
目前有8千多人写了短评,但我们知道豆瓣最多只能查看 500 条短评数据,我们的数据来源就取 500 条短评数据。
获取数据
首先,我们通过 Python 爬取《龙岭迷窟》 500 条豆瓣短评数据,代码的具体细节这里就不说了免得篇幅过长。
我们爬取的数据项包括:评论用户、评论时间、评论星级、评论内容。
分析数据
数据我们已经取到了,接下来我们开始对所获取的数据进行分析。
评论数量
首先,我们来看一下不同时间用户的评论数量
看一下效果图:
尽管该剧截止目前只有 4 天的评论数据,我们从图中也不难发现一些规律:我们可以看出 4 月 1 日和 2 日两天的评论数量较多,其中 4 月 1 日为首播日,评论数量多合乎情理,而 4 月 2 日评论数量多于 4 月 1 日,我们可以推测是因为该剧播出之后迅速传播的结果,也就是让更多的人知道了该剧,之后随着时间的推移热度会有所下降,评论数量呈递减的趋势,评论数量变化的趋势也侧面反映了该剧热度变化的大致趋势。
人物角色
接着,我们来看所获取的评论数据中,剧中主要角色被提及的次数。
看一下效果图:
从图中我们可以看出被提及角色数量的前三甲为:胡八一、王胖子、大金牙,通过角色被提及的次数,我们也可以大致推测出剧中角色的受欢迎程度。
评论星级
再接着,我们看一下该剧每天用户的评论星级,星级最高为 5 星,一天中如果有多条评论星级数据,我们则取其平均值。
看一下效果图:
我们从图中可以看出该剧评论星级大致维持在 4 星以上,说明大部分用户对于该剧的质量是比较认可的,评论星级也基本反映出了用户对于该剧的满意度。
词云展示
最后,我们对评论内容进行词云展示,看一下哪些词汇才是评论区的热门词汇。
看一下效果图:
总结
评分 8.3 评分 F 型 评论人数近 3.6W结论:评分有效,口碑很好,值得一看
2020年最新Python教程:
如果你处于想学Python或者正在学习Python,Python的教程不少了吧,但是是最新的吗?
说不定你学了可能是两年前人家就学过的内容,在这小编分享一波2020最新的Python教程。
以上这些教程小编已经为大家打包准备好了,希望对正在学习的你有所帮助!
获取方式,私信小编 “ 资料 ”,即可免费获取哦!
python爬取《龙岭迷窟》的数据,看看质量剧情还原度到底怎么样相关推荐
- 龙岭迷窟真的这么好看?今天我们就用 Java 爬取豆瓣数据好好分析一下!
每天早上七点三十,准时推送干货 首图来自最近热播的『鬼吹灯之龙岭迷窟』,看过上一部『鬼吹灯之怒晴湘西』同学应该能看懂这个笑点.潘粤明老师上一部还是卸岭魁首陈玉楼,这一部摇身一变成了胡八一. 好了,不扯 ...
- 用python爬取《龙岭迷窟》评论,看看比同系列鬼吹灯作品以及《盗墓笔记》好在哪里?
大家好,我是朱小五 最近不知道大家发现没有,新出了几部国产好剧,其中小五比较喜欢的就是鬼吹灯系列的<龙岭迷窟>. 自从开播以来,获得好评无数,豆瓣评分开播8.4分,目前有所回落,维持在8. ...
- 用python爬取《龙岭迷窟》评论,看看比同系列鬼吹灯作品以及《盗墓笔记》好在哪里?...
作者:朱小五 来源:凹凸数据 最近不知道大家发现没有,新出了几部国产好剧,其中小五比较喜欢的就是鬼吹灯系列的<龙岭迷窟>. 自从开播以来,获得好评无数,豆瓣评分开播8. ...
- 用python爬取《龙岭迷窟》评论,制作词云,看看与《盗墓笔记》的区别在哪里
本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理 本文章来自腾讯云 作者:Python进阶者 想要学习Python?有问题得不到第一 ...
- 潘粤明的《龙岭迷窟》到底怎么样?我用 Python 得出了一些结论!
对于天下霸唱的鬼吹灯,相信很多小伙伴都知道,它可谓是国内盗墓寻宝系列小说的巅峰之作,最近得知该系列小说的<龙岭迷窟>部分被制作成了网剧,已经于 4 月 1 日开播了,主要演员潘粤明.姜超. ...
- 递推 SDUT 鬼吹灯之龙岭迷窟
鬼吹灯之龙岭迷窟 Description 在古希腊时期,有一天毕达哥拉斯走在街上,在经过铁匠铺前他听到铁匠打铁的声音非常好听,于是驻足倾听. 他发现铁匠打铁节奏很有规律,这个声音的比例被毕达哥拉斯用数 ...
- Python爬取王者荣耀英雄的皮肤数据并下载皮肤图片项目
Python爬取王者荣耀英雄的皮肤数据,并下载皮肤图片!高清的图片用来做桌面也不错哟~ 网址:https://pvp.qq.com/web201605/herolist.shtml 1.获得英雄信息, ...
- 利用python爬取丁香医生上新型肺炎数据,并下载到本地,附带经纬度信息
新增:国外疫情网站介绍 已更新:爬取国外疫情数据 已更新:新型肺炎历史数据下载 2020年3月27日补充: 制作了一个全球肺炎数据查询下载网站,效果如下: 访问地址:http://119.3.227. ...
- python爬取电脑本地数据_利用python爬取丁香医生上新型肺炎数据,并下载到本地,附带经纬度信息...
原标题:利用python爬取丁香医生上新型肺炎数据,并下载到本地,附带经纬度信息 新型肺炎肆虐全国,可以预知,最近一两年地理学中会有一部分论文研究新型肺炎的空间分布及与其他指标的关联分析.获取其患病人 ...
最新文章
- Loadrunner连接负载机失败,提示Failed to connect to the load generator.Check the output window for more detail
- linux ftp 命令集合
- 插入排序之——二分(折半)插入排序(c/c++)
- 【采用】【风控系统】风控中心—京东基于Spark的风控系统架构实践和技术细节
- aix oracle 10.2.0.1 升级 10.2.0.4,AIX Oracle RAC 升级到10.2.0.4.0要特别注意的问题 - 爱肯的专栏 ......
- JEECG 缓存用法
- matlab超出维度,求助。。。matlab索引超出维度要怎么修改。。。谢谢
- MaxScript 扇子打开
- PAT (Basic Level) Practice (中文)1043 输出PATest (20 分)
- js jquery 判断元素是否在数组内
- ORM框架之Spring Data JPA(一)Hibernate实现JPA规范
- XStream实现缓存
- iOS中Storyboard使用要点记录
- CMake交叉编译配置
- @value 默认值_【Spring】只想用一篇文章记录@Value的使用,不想再找其它了(附思维导图)
- 冲击波内幕点滴 (转)
- 添加内核驱动模块(3)(mydriver.c+ Konfig+Makefile )
- C语言——坦克大战(纯控制台显示)
- 中软防水坝 怎么卸载_卸载中软防水墙软件 | 学步园
- linux 安装pkg文件,pkgfile (简体中文)