相信昨天的Breaking news(爆搜)是本世纪伟大的物理学家霍金辞世,享年76岁。小伙伴肯定知道霍金的故事肯定很励志,他是智商肯定不是常人能及的,因为他的引领,不断的拓宽了人类对宇宙的认识。

作为一名普通吃瓜群众,《时间简史》、《果壳中的宇宙》这些高大上的天书能知道名字就已经十分不错了,如果想看的话,要做好听凉凉的心里准备。

不过别慌,看书看不懂,看电影总能更好接受一些吧,关于霍金的人物传记电影名叫《The Theory of Everything》,翻译过来是:《万物理论》,真是高大上哇~~这部电影首映距今有3年多了,那么作为程序猿,我们应该如何来缅怀这位伟大的科学家呢?言归正传,小编利用Python网络爬虫来爬取《万物理论》的影评,缅怀一些逝去的巨星。

这个流程很简单,首先利用Python网络爬虫在豆瓣网上爬取电影短评,之后利用Python强大的分词库—jieba,对抓取到的电影短评做一个分词处理,再对处理后的词语进行相应的词频统计。最后,通过词云可视化对大家对该片的评论做一个展示,并分析其中的关键信息,具体流程如下。

第一步:抓取《万物理论》页面的短评信息

抓取《万物理论》页面的短评信息

第二步:使用Jieba分词对采集到的文本进行分词处理

Jieba分词处理

第三步:使用WordArt对分词文本进行词频统计并进行词云可视化展示

利用wordArt(https://tagul.com/)这款强大的免费在线生成词云的工具,将生成的关键词输入到词云工具中去。

选择对比度高的照片的作为词云制作背景图(背景图设为霍金),之后在线自动生成词云图,其效果图如下:

换个词云背景,其效果图如下所示:

通过词云可视化,不难从词云中看出,字体较大的内容主要涉及:霍金、电影、雀斑、爱情、时间、伟大、传记等,这些词是电影短评中出现的高频词汇,可以推断出大家霍金脸上的雀斑以及他和简·王尔德(他的妻子)之间的爱情印象比较深刻。此外,我们也可以感受到读者们基本上都认可霍金这一位伟大又杰出的物理学家。

最后介绍一下斯蒂芬·威廉·霍金(Stephen William Hawking)——1942年1月8日出生于英国牛津,英国剑桥大学著名物理学家,现代最伟大的物理学家之一、20世纪享有国际盛誉的伟人之一。

我们会永远怀念他 ~~

python爬虫高级知识分子的风骨_Python程序员爬取《万物理论》10万影评,带你解读霍金的有趣故事...相关推荐

  1. python程序员爬取分析20万场吃鸡数据,带妹吃鸡,终成人生赢家

    首先,神枪镇楼 python程序员爬取分析20万场吃鸡数据,带妹吃鸡,终成人生赢家 吃鸡,撩妹神器 吃鸡游戏受到很多年轻人的喜爱,用户量也非常大.有很多地图,场景逼真,技术玩法,增加了游戏可玩性.而且 ...

  2. python爬虫实战之图灵社区图书信息的爬取(找了久,才找到一个比较好爬取的网站)

    python爬虫实战之图灵社区图书信息的爬取 程序的描述 目标 获取图灵社区(https://www.ituring.com.cn/book)中40本图书的书名 将获取的信息以列表的形式输出到屏幕上, ...

  3. Python爬虫新手入门教学(十):爬取彼岸4K超清壁纸

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. Python爬虫.数据分析.网站开发等案例教程视频免费在线观看 https://space. ...

  4. Python爬虫: 单网页 所有静态网页 动态网页爬取

    Python爬虫: 单网页 所有静态网页 动态网页爬取 前言:所有页代码主干均来自网上!!!感谢大佬们. 其实我对爬虫还挺感兴趣的,因为我玩instagram(需要科学上网),上过IG的人都知道IG虽 ...

  5. Python爬虫新手入门教学(十七):爬取yy全站小视频

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. Python爬虫.数据分析.网站开发等案例教程视频免费在线观看 https://space. ...

  6. Python爬虫新手入门教学(十三):爬取高质量超清壁纸

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. Python爬虫.数据分析.网站开发等案例教程视频免费在线观看 https://space. ...

  7. python怎么爬取b站_【Python爬虫实例学习篇】——4、超详细爬取bilibili视频

    [Python爬虫实例学习篇]--4.超详细爬取bilibili视频 由于经常在B站上学习,但无奈于家里网络太差,在线观看卡顿严重,于是萌生了下载视频的想法(如果只是单纯想下载视频,请用you-get ...

  8. Python爬虫新手入门教学(二):爬取小说

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. Python爬虫.数据分析.网站开发等案例教程视频免费在线观看 https://space. ...

  9. 甲骨文华育兴业|【大数据调查】80%的程序员年薪都在10万以上,三分之一的人年薪20万以上

    看了上面文章的小伙伴 如果感到不舒适 那么请看看这篇文章 非常适合你找准方向 你们印象中程序员是什么样?他们的实际生活状态怎样?针对中国程序员薪资生存现状做了一项调查,大数据让你更懂程序员.(以下数据 ...

最新文章

  1. 浅析Python中bytes和str区别
  2. NClay.MVC是MVP?
  3. oracle php 执行时间,在执行Oracle pl/sql-oci8的PHP中,什么时候执行自动回滚?
  4. 借收购搭桥,风河Workbench软件环境涵盖至测试领域
  5. Spring Cloud Zuul重试机制探秘
  6. HDU 3564 Another LIS
  7. abap object-oriented–使用事件
  8. KNN算法和kd树详解(例子+图示)
  9. this指向,防抖函数中的fn.apply(this,arguments)作用
  10. Delphi XE5应用开发支持的安卓设备
  11. 360随身wifi,不通过360wifi软件,直接运行网卡模式
  12. java:多线程的 共享资源冲突问题
  13. 关注流浪猫:从我们出发
  14. Linux-5.10源代码之网络系统简介:
  15. 前端模板-2【vue部分小功能、bug处理】
  16. uni-app启动时间太长
  17. 刘长炯 beansoft(myeclipse_java) 一个不错的作者
  18. 人工智能自然语言处理在人力资源管理方面的应用
  19. 算法设计与分析--蛮力法
  20. 后台填充pdf数据后并下载 的实现

热门文章

  1. 快过年了,春运到了,带你用python来抢票回家!
  2. 小程序实现手写板签名
  3. The Open Group 开放流程自动化™ 论坛 O-PAS™ 标准 2.0 版
  4. IFrame使用-1
  5. 透过源码学习设计模式5—状态模式和Spring状态机
  6. 图谱实战 | 面向小白的知识图谱推理扫盲案例:知识推理的任务界定、主流方式以及基于TransE模型的知识推理实践...
  7. 盘点Python网页开发轻量级框架Flask知识(下篇)
  8. 【Three.js基础】创建场景、渲染场景、创建轨道控制器(一)
  9. word如何选择图片粘贴
  10. 黑马程序员----JAVASE之交通灯管理系统