文/程天 版面/胡曼君

镝摘

如果再过20年,你还会记得那些年上过的网易云热评吗?

看了那么多的网易云热评,技术思维作祟,我终于也忍不住写个爬虫,用Python通过对1008328条网易云音乐热评的抓取,我们可以得出一个对百万热评的基本风格画像。

以下三个链接是网易云音乐歌单列表、歌单和歌曲的示例链接。

http://music.163.com/#/discover/playlist

http://music.163.com/#/playlist?id=124974725

http://music.163.com/#/song?id=28875230

抓取热门歌单

01

\$ python playlist.py 粤语 1 10

\$ # 抓取粤语歌单列表热门前十页

\$ python playlist.py 1 10

\$ # 抓取热门歌单前十页的歌单名字和链接

抓取歌单内歌曲

02

\$ python music.py database

\$ # 抓取存储的热门歌单里面的歌曲,批量抓取

\$ python music.py playlist 376259016

\$ # 抓取编号为 376259016 的歌单

抓取歌曲评论

03

\$ python comment.py

\$ # 自动抓取已存储歌曲,并保持去重复

TODO

04

增加抓取歌单页面个性推荐歌单

增加抓取排行榜

严格去重复

优化代码结构,冗余代码过多

BUG

05

若干歌单无法抓取,待重现定位

...

(具体技术细节请阅读原文了解Github上面源码)

...

接下来我们就可以看到bling bling的分析结果了!

1.评论TOP20歌曲:

可以看到,近年在网易云音乐大红的薛之谦在名单上独占六席,这非常不容易。当然,近十年华语乐坛最成功的流行音乐创作歌手周杰伦,在这份名单上以一首《晴天》排名第一,并且领先第二名接近一倍的评论数。

那么我们换一个维度,看看哪些歌手被评论最多:

图中包括陈粒、李荣浩、李志、赵雷、陈奕迅、王菲宋冬野等人物悉数入选,他们也是近些年华语乐坛粉丝比较狂热或者作品比较丰富的歌手。

然后,让我们看看,那些热评,都写的什么?

2.Top10热门的带故事的评论

相对于上面这些带故事的评论,似乎网易云音乐全站Top20的热评也不全都是那些常规意义的“好评论”,譬如:

你眼里的段子,其实是别人的故事。

点击下方阅读原文。

python可视化分析网易云音乐评论_网易云音乐评论催泪刷屏?我用Python抓取了1008328条热评告诉你为什么!...相关推荐

  1. 网易云音乐评论催泪刷屏?我用Python抓取了1008328条热评告诉你为什么!

    如果再过20年,你还会记得那些年上过的网易云热评吗? 看了那么多的网易云热评,技术思维作祟,我终于也忍不住写个爬虫,用Python通过对1008328条网易云音乐热评的抓取,我们可以得出一个对百万热评 ...

  2. [转载] python可视化分析(matplotlib、seaborn、ggplot2)

    参考链接: Python Matplotlib数据可视化2 python可视化分析总结(matplotlib.seaborn.ggplot) 一.matplotlib库1.基本绘图命令3.图形参数设置 ...

  3. python可视化分析(matplotlib、seaborn、ggplot2)

    python可视化分析总结(matplotlib.seaborn.ggplot) 一.matplotlib库 1.基本绘图命令 3.图形参数设置 4.特殊统计图的绘制 4.1 数学函数图 4.2 气泡 ...

  4. python可视化分析网易云音乐评论_Python数据可视化:网易云音乐歌单

    通过Python对网易云音乐华语歌单数据的获取,对华语歌单数据进行可视化分析. 可视化库不采用pyecharts,来点新东西. 使用matplotlib可视化库,利用这个底层库来进行可视化展示. 推荐 ...

  5. c罗python可视化分析_关于C罗“冲刺速度”这种隐私问题,我们在Kaggle上找到了数据集,然后。。。...

    原标题:关于C罗"冲刺速度"这种隐私问题,我们在Kaggle上找到了数据集,然后... 今日份知识你摄入了么? 你知道 FIFA 么?在线踢足球那种,贼老多人玩儿这个游戏,本仙女作 ...

  6. c罗python可视化分析_梅西、内马尔谁是全能的五边形战士?教你用BI做出可视化能力图...

    #数据分析# 最近因为欧洲疫情的原因,好多足球比赛都不得不停止,相信很多球迷现在在家中都没办法看比赛了. 而同样作为球迷的我突发奇想,如果用数据分析的角度去看欧洲的世界级球员,是否每个都名副其实呢? ...

  7. 13分钟,教你python可视化分析20W数据,找到妹子最爱的内衣

    最近正值"618活动",阿里.拼多多.京东等都在发力,商品的价格也下降了不少.我打开某宝首页,顿时想对某些商品的评论进行一次爬取分析. 一提到爬取,我们肯定先想到python,那可 ...

  8. 大数据总监python可视化分析30W数据后,找到了抹黑我们的原因

    真利益相关,人在国内,刚下...算了,在办公室. 我不知道是谁在推特上抹黑我们,我也不想知道他们为什么这么对待我们,作为大数据行业的一员,我觉得什么东西都得有数据来证明对吧,如果靠嘴的话,那对面早就赢 ...

  9. Python可视化分析和预测大型流行病和COVID19如何影响金融市场

    通过过去流行病的信息,并定量分析对金融市场的影响. 使用Python可视化并分析数据 我们正处于一个不确定的环境中,这也反映在金融市场上. 您会遇到很多问题,例如COVID19将如何影响金融市场,股市 ...

最新文章

  1. 获取枚举类型的 中文 描述 和值
  2. Mongodb aggregation 基本操作示例
  3. 打开金蝶K/3控制台提示“连接中间层加密服务失败,请确认中间层加密服务已启动”...
  4. legend3---OpenSSL SSL_read: SSL_ERROR_SYSCALL, errno 10054
  5. Leetcode1701. 平均等待时间[C++题解]:模拟题
  6. jmeter之调度器配置
  7. Lucene学习总结之七:Lucene搜索过程解析
  8. c语言用队列stl加头文件,C++ STL List队列用法(实例)
  9. 【AI独角兽招聘】这里有一个梦,我们一同前往…
  10. string s=new string() 创建了几个对象_Java的String类5个常见面试题的解答过程和原理...
  11. 运算符重载 返回类型说明符后加_Python3基础:从独特的角度看运算符重载
  12. PyTorch自定义CUDA算子教程与运行时间分析
  13. 程序员计算器HEX、EDC、OCT的意思
  14. 微带滤波器摘要_微带线带通滤波器设计
  15. Spring Cloud Alibaba Sentinel(七)受权规则 黑白名单
  16. XMPP 客户端和服务端
  17. HCIA-USG Security Policy
  18. Iphone, Ipad, Iwatch 屏蔽系统更新提示
  19. 【Clemetine】基于二项Logistic回归的电信客户流失预测
  20. 量子计算机和超导计算机,量子计算与超导量子计算机.pdf

热门文章

  1. 读书笔记 | 4.1 信用报告及其国际比较
  2. uniapp 自制头部左侧胶囊组件
  3. XLA编译器用于JIT加速
  4. 制造业的一般生产流程
  5. 程序大咖的博客集锦_更新Unity3d
  6. 031_onetab
  7. 王者荣耀购买装备----笔记
  8. 六种黑客入侵手机的常见方式
  9. 【亚马逊】AWS re:Invent 2022 创新不平衡
  10. 台式计算机怎样能搜无线连接,台式电脑怎么设置无线网络!台式电脑也能上wifi...