Python 来分析,堪比“唐探系列”!B站9.5分好评如潮!
作者 | 菜鸟哥
来源 | 菜鸟学Python
Hello 小伙伴们,最近一部非常不错的悬疑+侦探+喜剧 电影,登上B站热榜!菜鸟哥看完之后,大呼过瘾,简直就是一本非常棒的"剧本杀"!演员都是实力派,演技超级好,剧情设计太有节奏感了!尤其是片尾的大反转,亮点很多。
短短几天的时间,播放量接近2000万,更是收获了9.5分的评价。接下来,我们一起来看看,扬名立万究竟是一部怎样的电影吧。
故事发生在民国时期,月黑风高之夜,一群失意电影人不约而同地受到上海滩大亨陆子野的邀请,来到一栋神秘大别墅,参加电影剧本讨论会。试图将一桩轰动上海的重大命案改编成电影。而随着讨论的逐渐深入,他们发现这栋别墅就是案发现场,齐头扎进了一个巨大的迷局,暗处的黑势力也在虎视眈眈,而凶手就在他们中间。
豆瓣影评
该部电影主打的是悬疑+喜剧的题材,围绕一群电影人展开故事主线。题材内容富有张力。为充分了解大家对于影片的评价,我们从B站弹幕和B站影评两个角度来抓取数据。
B站弹幕
对于弹幕的数据抓取,程序如下图所示:
上述的程序内容非常的简单,利用requests库来提取网页数据后,利用BeautifulSoup来解析网页数据后,获取到弹幕的内容、颜色以及字体等内容,最后将数据保存到本地。
程序中最为关键的点是cid数值的获取。如下图所示:
在网页当中,点击“F12”,打开开发者模式后,在网络下,通过搜索cid的关键词,来找到cid的数值。
接下来我们首先来分析一下弹幕数据。
对于观影者来说,弹幕的发送时间往往跟用户的观影时间呈现强相关性。
如上视频所示,弹幕的数量有两个高峰时间段,分别是晚上八点到凌晨以及下午的一点到六点。
假期期间,大家有着充分的观影时间,无论是白天或者是晚上,都可以随时随地观看电影发送弹幕。
而在大家的弹幕词云,如下图所示。
在弹幕当中,大家发送最多的弹幕当然是“新年快乐”,并且包含了“前方高能”等常见的弹幕用语。弹幕更多的是观影用户的随手发送的信息,不能很好体现对于电影本身的评价。
因此接下来我们来进一步的来抓取B站的影评数据:
上图是抓取B站影评的全部程序,程序的主入口是run函数。
58-72行函数,利用requests库来请求数据后,解析返回的json数据,并提取data数据,然后利用get_detial_data函数来获取详细的数据内容。
对于获取的影评数据,我们先看一下大家的评分数据。
从大家的评分数据可以看出,接近87%的影评给出了满分10分的评价。超过九成的用户给出了8分以上的评分。足以见得用户对于该部影片的喜爱和支持。
在用户的影评当中。对该部影片给予了高度的评价,“好看”、“不错”等褒义词成为了高频关键词。错过电影院观看的小伙伴们,非常值得花6块钱在B站看一下这部电影。
以上便是今天同大家对于《扬名立万》这部影片的分享,有喜欢的小伙伴可以前往B站观看;尤其是最后的结局,一些细节很有意思。最后男主角李家辉为啥没有去截住“夜莺”,以及最后越南两船相撞,主角团一行人有没有到死掉,照相馆无人取的照片等等。
往
期
回
顾
资讯
Meta开发AI语音助手,助力元宇宙
技术
Pandas重复数据处理大全
技术
5个短小精悍的Python趣味脚本
资讯
M2芯片终于要来了?全线换新
分享
点收藏
点点赞
点在看
Python 来分析,堪比“唐探系列”!B站9.5分好评如潮!相关推荐
- 用Python数据处理分析入门必备系列文章:环境安装
最近有挺多小伙伴问我要入门 Python 的资料,还有小伙伴完全没有入门 Python 就直接购买了我的 pandas 专栏.因此我决定写几篇 Python 数据处理分析必备的入门知识系列文章,以帮助 ...
- 《李焕英》票房反超,全靠《唐探3》衬托?
来源 | 深燃 ID | shenrancaijing 作者 | 魏婕 编辑 | 黎明 春节假期过去了,电影春节档的热度依然不减.<唐人街探案3>和<你好,李焕英>一路缠斗,按 ...
- python视频口碑佳_从万众期待到口碑扑街!用Python来分析一下大家对唐探3的评论...
原标题:从万众期待到口碑扑街!用Python来分析一下大家对唐探3的评论 来源 |菜鸟学Python 作者 |菜鸟哥 唐人街探案系列题材,凭借着演员出色的表演,以及精彩的探案故事,近些年来成为了一部很 ...
- 从万众期待到口碑扑街!唐探3令人失望,用Python来分析一下大家的评论
公众号 "菜鸟学Python" 第443篇原创,设为 "星标",一起学Python! 唐人街探案系列题材,凭借着演员出色的表演,以及精彩的探案故事,近些年来成为 ...
- python+jieba分析唐诗三百首
python+jieba分析唐诗三百首 代码及源文件地址:poem_300 代码保证符合命名规范.遵循PEP8规则.导包顺序清晰.尽量做到复用性和不罗嗦 记得修改文件路径哟(^U^)ノ~YO 如果有帮 ...
- Python股票分析系列——基础股票数据操作(二).p4
该系列视频已经搬运至bilibili: 点击查看 欢迎来到Python for Finance教程系列的第4部分.在本教程中,我们将基于Adj Close列创建烛台/ OHLC图,这将允许我介绍重新采 ...
- Python股票分析系列——系列介绍和获取股票数据.p1
本系列转载自youtuber sentdex博主的教程视频内容 https://www.youtube.com/watch?v=19yyasfGLhk&index=4&list=PLQ ...
- Python股票分析系列——数据整理和绘制.p2
Python股票分析系列--数据整理和绘制.p2 欢迎来到Python for Finance教程系列的第2部分. 在本教程中,我们将利用我们的股票数据进一步分解一些基本的数据操作和可视化. 我们将要 ...
- python量化分析系列之---5行代码实现1秒内获取一次所有股票的实时分笔数据
python量化分析系列之---5行代码实现1秒内获取一次所有股票的实时分笔数据 最近工作太忙了,有一个星期没有更新文章了,本来这一期打算分享一些对龙虎榜数据的分析结果的,现在还没有把数据内的价值很好 ...
最新文章
- linux 版本察看 redh,GLOBK重要命令htoglb glred的翻译
- 外网服务器搭建网站并获取域名教程
- ip、子网掩码、默认网关以及传输过程
- 【多目标优化求解】基于matlab布谷鸟算法多目标(成本+时间+质量)优化求解【含Matlab源码 118期】
- 智慧消防:如何利用智能化手段,精准防控消防风险?
- 利用公网Msf+MS17010跨网段攻击内网
- 考育婴师看什么书?中级育婴师需要备考多久?
- wordpress设置首页为特定页
- 翟东平微信公众号视频教程JAVA201810版2/3阶段-翟东平-专题视频课程
- CRUSH与PG分布
- 你不可不用的十类Mac装机必备软件
- 软件测试用例编写规范文档,模板都给你了我看谁还不会写测试用例
- 谈VB.net里Optional关键字
- EasyPR--一个开源的中文车牌识别系统
- 当下的事,就是最重要的事,安下心,用良知去处理
- caffe层解析之softmaxwithloss层
- ANSYS Autodyn仿真基础到高级视频教程
- “咖哥”变身数据侦探,手撕商业分析实战
- JavaScript高级(BOM+DOM)学习
- Object.defineProperty 的实际应用
热门文章
- 什么是整型?Python整型详细介绍
- Java基础学习总结(9)——this关键字
- DTCC:数据库安全重点在数据拷贝过程中
- 数据中心节能大法 —— 尽在上海11月中国数据中心展
- FairyGUI和NGUI对比
- Mysql INSERT、REPLACE、UPDATE的区别
- oracle netca 乱码,Oracle 11g 安装及netca,dbca乱码之解决
- java验证码源码_Java通用验证码程序及应用示例(提供源码下载)
- java代码使用http请求解压zip包并解析xml_Javascript 是如何解析 Excel 文件的?
- java开心消消乐代码_今晚请屏住呼吸,开心消消乐拍电影了!