友情提示:文末有...

一次完整的python分析+可视化展示,是什么样的?

比如我想知道知乎用户的学历,是否都是985呢?我还想知道知乎最受关注的话题都是些什么?高端人士都喜欢看什么书呢?“人在XX,刚下飞机?”这句话出现的频率有多高呢?

最快的方法是用python爬虫然后加BI可视化分析!python爬虫仅需几步就可以完成:

找到网页URL,查看HTML代码

在HTML代码中找到你要提取的数据

写python进行网页请求和解析

存储数据,Excel导出

于是我使用10000秒的时间写了5000行代码,爬取了知乎下5646个话题与回答,10W+用户,和我预想的结果完全不一样。

我们先放一部分代码,完整的可以到文末看评论~

最后爬取了大概快60W的数据,我们接下来要对它进行数字可视化的分析。

我们想通过数据知道什么?

知乎人均985吗?

知乎最受关注的话题是哪些?这些话题的关系图谱是怎么样的?

知乎大佬最推荐的书是哪些?

知乎的娱乐栏目最受关注的都是哪些?

在分析之前,我们得挑选一个数据可视化工具,有人会问:为什么不用python呢?因为python处理数据或许很不错,但其实它并不简单,分析起来是很困难的,SQL语句、Pandas和Matplotlib这些十分繁琐,一般人也不会。

所以我想到既然有现成数据的话,那选择一个可以直接连接数据源的工具就更好了,我想到了BI里的佼佼者FineBI,轻便敏捷的数据分析能力,浏览器里就可以直接操作,而且对于大数据量可以及时响应,直接拖拽即可生成可视化。

虽然主打的是企业级的数据分析工具,但是个人也是可以用的,而且是free的,功能并不会减少,可谓良心。很多企业依然有各种各样的数据问题:IT-业务沟通困难,领导决策缺乏数据支撑....

FineBI从IT、业务、管理层三个方面去解决问题:

通过自助数据集功能,普通业务人员就能对数据做筛选、切割、排序、汇总等,自助灵活地达成期望的数据结果。

BI工具就介绍到这里,接下来我们看知乎的可视化分析,以下都是由FineBI所作。

1、知乎是否人均985?

一看这个学校,我自卑了!!!果真人均985,211,怪不得知乎上很多回答都显得很有哲理的样子,果然,学历越高的人见识越多,看来好好学习真的很重要。不过,我说知乎的学历比虎扑高没有人反对吧。

当然,这些数据的前提都是基于你自己填写的是准确的,大专给自己填哈佛我也没办法...

2、知乎最受关注的话题是哪些?

大佬们上知乎,都会去浏览什么问题呢?就拿数据领域来说,这两份关系图可以说是最全的了,如果你想从0-1进入数据行业,这是一个很好的基础学习方向。

3、知乎大佬最推荐的书是哪些?

读万卷书,行万里路,没点知识怎么好意思刷知乎呢?

我把所有关于文学书籍推荐的问题都爬了一遍,统计下来就是这10本书排名前列,很遗憾,我只看过1本...

4、在娱乐类目上,知乎的人都喜欢关注什么呢?

其实和微博一样,知乎也算是一个获取知识的平台,而且现在越来越多的人都把知乎当作微博来看,评论区的智商会高很多(我没有别的意思)。

一直流传着一句话:微博前脚火什么,知乎后脚扒什么...真实!

总结

知乎的分析就到这里了,你可以看见python+finebi真的就是非常棒的组合,无论是数据处理,还是数据展示,想要分析什么,简直就是手到擒来!

最后,以上的分析如果有不足的地方,欢迎告诉我!

关注我,并转发该文章,私信回复“BI”,即可获得数据分析工具和源代码!

python5000行代码项目_5000行python代码+可视化60W数据,告诉你知乎用户不为人知的事...相关推荐

  1. python 知乎关系图谱_5000行python代码+可视化60W数据,告诉你知乎用户不为人知的事...

    一次完整的python分析+可视化展示,是什么样的? 比如我想知道知乎用户的学历,是否都是985呢?我还想知道知乎最受关注的话题都是些什么?高端人士都喜欢看什么书呢?"人在XX,刚下飞机?& ...

  2. 如何防止你的代码被窃取?Python代码加密方案汇总(带实例验证)

    Python代码加密方案汇总 文章目录 Python代码加密方案汇总 需求描述 基础:Python文件格式 `.py` python源代码 `.pyc` 编译得到的字节码文件 `.pyo` 编译优化后 ...

  3. python语言代码片段-有用的Python代码片段

    我列出的这些有用的Python代码片段,为我节省了大量的时间,并且我希望他们也能为你节省一些时间.大多数的这些片段出自寻找解决方案,查找博客和StackOverflow解决类似问题的答案.下面所有的代 ...

  4. python代码需要背吗-Python代码需要缩进吗

    Python则是通过缩进来识别代码块的. 缩进 Python最具特色的是用缩进来标明成块的代码.我下面以if选择结构来举例.if后面跟随条件,如果条件成立,则执行归属于if的一个代码块. 先看C语言的 ...

  5. python语言必背代码-让你的Python代码实现类型提示功能

    Python是一种动态类型语言,这意味着我们在编写代码的时候更为自由,但是与此同时IDE无法向静态类型语言那样分析代码,及时给我们相应的提示.为了解决这个问题,Python 3.6 新增了几个特性PE ...

  6. python文件下载器代码_GitHub - applechi/pythonCollection: python代码集合(文件下载器、pdf合并、极客时间专栏下载、掘金小册下载、新浪微博爬虫等)...

    json2mysql 这次更新了将一个json文件中的数据导入到mysql的脚本. 是用nodejs写的. 对应的文件是tomysql.js 有兴趣的同志可以研究下. pythonCollection ...

  7. python代码-让你的Python代码实现类型提示功能

    Python是一种动态类型语言,这意味着我们在编写代码的时候更为自由,但是与此同时IDE无法向静态类型语言那样分析代码,及时给我们相应的提示.为了解决这个问题,Python 3.6 新增了几个特性PE ...

  8. python代码编程教学入门,python代码编程火影忍者

    python源代码编程软件 编写python源代码的软件.首推的Pycharm. PyCharm用于bai一般IDE具备的功能,比如, 调试.语法高亮.Project管理.du代码跳转.智能提示.自动 ...

  9. python简单的画图代码爱心,怎么用python代码画心

    大家好,本文将围绕用python画一个心形怎么编程展开说明,python简单的画图代码爱心是一个很多人都想弄明白的事情,想搞清楚用python画爱心的程序代码需要先了解以下几个事情. 1.python ...

最新文章

  1. Build Boost C++ libraries for x32/x64 VC++ compilers on Windows
  2. mysql的windows安装步骤_window mysql安装详细步骤
  3. 已知图片大小,让其在页面中垂直水平居中
  4. SAP Commerce Cloud启动时遇到的9001端口被占用的问题
  5. 真正聪明的人,为什么从不去社交?
  6. 【Flink】FLink PipelineExecutorFactory 基于工厂模式的任务提交与SPI机制
  7. PAT 1090 危险品装箱(25 分)- 乙级
  8. spring component-scan配置扫描多个包
  9. VC动态库可以嵌套调用
  10. 在Windows系统中安装Go语言
  11. 计算机组成原理实验:静态随机存储器实验
  12. 吴军推荐给中学生的书单
  13. Xshell的一个轻量且免费的替代品ConEmu
  14. HOW TO LEECH USING IRC
  15. Whole Word Masking (wwm)
  16. cloudera-repos 地址
  17. 易语言制作计算机按键指令,关于易语言编写计算器的问题(完整代码!!!!!!!)
  18. 【转载】Tomcat崩溃事件
  19. 产品经理入门概念通识
  20. (转)dl,dt,dd标签的解析

热门文章

  1. 编译器为C++ 空类自动生成的成员函数
  2. 我爱你们,我的家人和朋友
  3. Win8 忘记密码 解决办法【在E450c实测有效】
  4. C++ 中list、vector和deque比较[转]
  5. laravel5.5 __construct函数 无法使用session() 解决方法和实例
  6. mavenFailed to execute goal org.apache.maven.plugins:maven-surefire-plugin解决方法
  7. js的跨域问题和解决办法
  8. 2021人工智能竞赛白皮书:1000场竞赛的深度分析
  9. 【干货】2021微信生态下的营销洞察.pdf(附下载链接)
  10. 速成pytorch学习——1天