如果再过20年,你还会记得那些年上过的网易云热评吗?

看了那么多的网易云热评,技术思维作祟,我终于也忍不住写个爬虫,用Python通过对1008328条网易云音乐热评的抓取,我们可以得出一个对百万热评的基本风格画像。

以下三个链接是网易云音乐歌单列表、歌单和歌曲的示例链接。

http://music.163.com/#/discover/playlist

http://music.163.com/#/playlist?id=124974725

http://music.163.com/#/song?id=28875230

抓取热门歌单 01

$ python playlist.py  粤语 1 10
$ # 抓取粤语歌单列表热门前十页

$ python playlist.py  1 10
$ # 抓取热门歌单前十页的歌单名字和链接

抓取歌单内歌曲 02

$ python music.py database
$ # 抓取存储的热门歌单里面的歌曲,批量抓取
$ python music.py playlist 376259016
$ # 抓取编号为 376259016 的歌单

抓取歌曲评论 03

$ python comment.py
$ # 自动抓取已存储歌曲,并保持去重复

TODO 04

增加抓取歌单页面个性推荐歌单

增加抓取排行榜

严格去重复  ✔️

优化代码结构,冗余代码过多

BUG 05

若干歌单无法抓取,待重现定位

...

接下来我们就可以看到bling bling的分析结果了!

01 评论TOP20歌曲:

可以看到,近年在网易云音乐大红的薛之谦在名单上独占六席,这非常不容易。当然,近十年华语乐坛最成功的流行音乐创作歌手周杰伦,在这份名单上以一首《晴天》排名第一,并且领先第二名接近一倍的评论数。

那么我们换一个维度,看看哪些歌手被评论最多:

图中包括陈粒、李荣浩、李志、赵雷、陈奕迅、王菲宋冬野等人物悉数入选,他们也是近些年华语乐坛粉丝比较狂热或者作品比较丰富的歌手。

然后,让我们看看,那些热评,都写的什么?

02 Top10热门的带故事的评论

相对于上面这些带故事的评论,似乎网易云音乐全站Top20的热评也不全都是那些常规意义的“好评论”,譬如:

你眼里的段子,其实是别人的故事。

来源:次元数据传媒实验室


精彩活动

福利 · 阅读 | 免费申请读大数据新书 第23期

推荐阅读

2017年数据可视化的七大趋势!

全球100款大数据工具汇总(前50款)

论大数据的十大局限

大数据时代的10个重大变革

大数据七大趋势 第一个趋势是物联网

Q: 那一句评论最打动你?

欢迎留言与大家分享

请把这篇文章分享给你的朋友

转载 / 投稿请联系:hzzy@hzbook.com

更多精彩文章,请在公众号后台点击“历史文章”查看

网易云音乐评论催泪刷屏?我用Python抓取了1008328条热评告诉你为什么!相关推荐

  1. python可视化分析网易云音乐评论_网易云音乐评论催泪刷屏?我用Python抓取了1008328条热评告诉你为什么!...

    文/程天 版面/胡曼君 镝摘 如果再过20年,你还会记得那些年上过的网易云热评吗? 看了那么多的网易云热评,技术思维作祟,我终于也忍不住写个爬虫,用Python通过对1008328条网易云音乐热评的抓 ...

  2. python爬网易云音乐评论最多的歌_使用Python爬一爬网易云音乐上那些评论火爆的歌曲...

    网易云音乐这款音乐APP本人比较喜欢,用户量也比较大,而网易云音乐之所以用户众多和它的歌曲评论功能密不可分,很多歌曲的评论非常有意思,其中也不乏很多感人的评论.但是,网易云音乐并没有提供热评排行榜和按 ...

  3. python爬虫网易云音乐评论最多的歌_使用Python爬一爬网易云音乐上那些评论火爆的歌曲...

    网易云音乐这款音乐APP本人比较喜欢,用户量也比较大,而网易云音乐之所以用户众多和它的歌曲评论功能密不可分,很多歌曲的评论非常有意思,其中也不乏很多感人的评论.但是,网易云音乐并没有提供热评排行榜和按 ...

  4. python爬取网易云音乐_Python 从零开始爬虫(七)——实战:网易云音乐评论爬取(附加密算法)...

    前言 某宝评论区已经成功爬取了,jd的也是差不多的方法,说实话也没什么好玩的,我是看上它们分析简单,又没加密才拿来试手的.如果真的要看些有趣的评论的话,我会选择网易云音乐,里面汇聚了哲学家,小说家,s ...

  5. python爬取评论_python爬取网易云音乐评论

    本文实例为大家分享了python爬取网易云音乐评论的具体代码,供大家参考,具体内容如下 import requests import bs4 import json def get_hot_comme ...

  6. python爬取网易云音乐评论并进行可视化分析

    2019独角兽企业重金招聘Python工程师标准>>> 前言 今天为大家一个爬取网易云音乐评论的Python案例,并用Python的第三方库来进行可视化分析,生成图表样式,可以清晰地 ...

  7. 44 万条数据揭秘:如何成为网易云音乐评论区的网红段子手?

    作者 | 朱小五 责编 | 伍杏玲 有个段子讲"十年文案老司机,不如网易评论区,网易文豪遍地走,评论全部单身狗",网易云音乐的评论区也一直都是各类文案大神的聚集地. 那么我们普通用 ...

  8. 爬虫之js加密破解抓取网易云音乐评论生成词云

    js破解历程 前言 技能点 界面概况 静态网页 动态网页 页面解析 step1: 找参数 step2:分析js函数 step3:分析参数 step4: 校验 step5:转为python代码 编写爬虫 ...

  9. python爬取网易云音乐热评_python爬取网易云音乐评论

    本文实例为大家分享了python爬取网易云音乐评论的具体代码,供大家参考,具体内容如下 import requests import bs4 import json def get_hot_comme ...

最新文章

  1. 凸函数和非凸函数---and why
  2. MFC中设备描述表dc的使用
  3. [攻防世界 pwn]——pwn-200
  4. BZOJ4562: [Haoi2016]食物链
  5. 二分答案——yyy2015c01 的 U 盘(洛谷 P2370)
  6. 绘制一幅蓝图_如何给新家绘制一张生活蓝图
  7. zsh重启后环境变量失效
  8. JavaScript 原型精髓 #一篇就够系列
  9. 机器学习笔记 - AutoML框架FLAML初体验
  10. FPGA实战篇——【2】按键控制LED灯闪烁
  11. word 插入脚注尾注和删除页眉页脚
  12. 本科计算机专业是机试,华东师大计算机专业复试上机复习攻略+机试技巧
  13. Web网页设计——“说旅游”
  14. HDU-1425 排序
  15. SQL之HAVING
  16. 新式单片机视频教程下载
  17. 图像的基本操作--反转、放大等
  18. WebMatrix进阶教程(8):创建删除数据网页
  19. 软件工程专业课实验报告
  20. sysctl优化linux网络

热门文章

  1. Qt工作笔记-使用QFileSystemWatcher监控文件是否改变
  2. ajax视频播放,XMLHttpRequest加载视频并播放
  3. 桥本有菜java,深入浅出Extjs4.1.1(ExtJS组件、ExtJS对Ajax支持、ExtJS布局)配在线选课系统实战...
  4. android 数据回传代码,安卓向.net core api传输图片,执行保存到数据库命令后返回400错误代码,用postman测试没有问题安卓程序不行...
  5. mysql面试吗hi提_面试必备的10道MySQL题
  6. 实木地板被机器人弄成坑_实木地板的常规保养
  7. HTML跳转为啥会404,为什么网页会出现404 not found?
  8. 计组之存储系统:5、cache(cache功能、cache工作原理、cache性能分析)
  9. (计算机组成原理)第三章存储系统-第六节4:Cache的写策略(写回法和全写法,写分配法和非写分配法)
  10. 3-4:一个简单的HTTP服务器