python可视化分析网易云音乐评论_网易云音乐评论催泪刷屏?我用Python抓取了1008328条热评告诉你为什么!...
文/程天 版面/胡曼君
镝摘
如果再过20年,你还会记得那些年上过的网易云热评吗?
看了那么多的网易云热评,技术思维作祟,我终于也忍不住写个爬虫,用Python通过对1008328条网易云音乐热评的抓取,我们可以得出一个对百万热评的基本风格画像。
以下三个链接是网易云音乐歌单列表、歌单和歌曲的示例链接。
http://music.163.com/#/discover/playlist
http://music.163.com/#/playlist?id=124974725
http://music.163.com/#/song?id=28875230
抓取热门歌单
01
\$ python playlist.py 粤语 1 10
\$ # 抓取粤语歌单列表热门前十页
\$ python playlist.py 1 10
\$ # 抓取热门歌单前十页的歌单名字和链接
抓取歌单内歌曲
02
\$ python music.py database
\$ # 抓取存储的热门歌单里面的歌曲,批量抓取
\$ python music.py playlist 376259016
\$ # 抓取编号为 376259016 的歌单
抓取歌曲评论
03
\$ python comment.py
\$ # 自动抓取已存储歌曲,并保持去重复
TODO
04
增加抓取歌单页面个性推荐歌单
增加抓取排行榜
严格去重复
优化代码结构,冗余代码过多
BUG
05
若干歌单无法抓取,待重现定位
...
(具体技术细节请阅读原文了解Github上面源码)
...
接下来我们就可以看到bling bling的分析结果了!
1.评论TOP20歌曲:
可以看到,近年在网易云音乐大红的薛之谦在名单上独占六席,这非常不容易。当然,近十年华语乐坛最成功的流行音乐创作歌手周杰伦,在这份名单上以一首《晴天》排名第一,并且领先第二名接近一倍的评论数。
那么我们换一个维度,看看哪些歌手被评论最多:
图中包括陈粒、李荣浩、李志、赵雷、陈奕迅、王菲宋冬野等人物悉数入选,他们也是近些年华语乐坛粉丝比较狂热或者作品比较丰富的歌手。
然后,让我们看看,那些热评,都写的什么?
2.Top10热门的带故事的评论
相对于上面这些带故事的评论,似乎网易云音乐全站Top20的热评也不全都是那些常规意义的“好评论”,譬如:
你眼里的段子,其实是别人的故事。
点击下方阅读原文。
python可视化分析网易云音乐评论_网易云音乐评论催泪刷屏?我用Python抓取了1008328条热评告诉你为什么!...相关推荐
- 网易云音乐评论催泪刷屏?我用Python抓取了1008328条热评告诉你为什么!
如果再过20年,你还会记得那些年上过的网易云热评吗? 看了那么多的网易云热评,技术思维作祟,我终于也忍不住写个爬虫,用Python通过对1008328条网易云音乐热评的抓取,我们可以得出一个对百万热评 ...
- [转载] python可视化分析(matplotlib、seaborn、ggplot2)
参考链接: Python Matplotlib数据可视化2 python可视化分析总结(matplotlib.seaborn.ggplot) 一.matplotlib库1.基本绘图命令3.图形参数设置 ...
- python可视化分析(matplotlib、seaborn、ggplot2)
python可视化分析总结(matplotlib.seaborn.ggplot) 一.matplotlib库 1.基本绘图命令 3.图形参数设置 4.特殊统计图的绘制 4.1 数学函数图 4.2 气泡 ...
- python可视化分析网易云音乐评论_Python数据可视化:网易云音乐歌单
通过Python对网易云音乐华语歌单数据的获取,对华语歌单数据进行可视化分析. 可视化库不采用pyecharts,来点新东西. 使用matplotlib可视化库,利用这个底层库来进行可视化展示. 推荐 ...
- c罗python可视化分析_关于C罗“冲刺速度”这种隐私问题,我们在Kaggle上找到了数据集,然后。。。...
原标题:关于C罗"冲刺速度"这种隐私问题,我们在Kaggle上找到了数据集,然后... 今日份知识你摄入了么? 你知道 FIFA 么?在线踢足球那种,贼老多人玩儿这个游戏,本仙女作 ...
- c罗python可视化分析_梅西、内马尔谁是全能的五边形战士?教你用BI做出可视化能力图...
#数据分析# 最近因为欧洲疫情的原因,好多足球比赛都不得不停止,相信很多球迷现在在家中都没办法看比赛了. 而同样作为球迷的我突发奇想,如果用数据分析的角度去看欧洲的世界级球员,是否每个都名副其实呢? ...
- 13分钟,教你python可视化分析20W数据,找到妹子最爱的内衣
最近正值"618活动",阿里.拼多多.京东等都在发力,商品的价格也下降了不少.我打开某宝首页,顿时想对某些商品的评论进行一次爬取分析. 一提到爬取,我们肯定先想到python,那可 ...
- 大数据总监python可视化分析30W数据后,找到了抹黑我们的原因
真利益相关,人在国内,刚下...算了,在办公室. 我不知道是谁在推特上抹黑我们,我也不想知道他们为什么这么对待我们,作为大数据行业的一员,我觉得什么东西都得有数据来证明对吧,如果靠嘴的话,那对面早就赢 ...
- Python可视化分析和预测大型流行病和COVID19如何影响金融市场
通过过去流行病的信息,并定量分析对金融市场的影响. 使用Python可视化并分析数据 我们正处于一个不确定的环境中,这也反映在金融市场上. 您会遇到很多问题,例如COVID19将如何影响金融市场,股市 ...
最新文章
- 获取枚举类型的 中文 描述 和值
- Mongodb aggregation 基本操作示例
- 打开金蝶K/3控制台提示“连接中间层加密服务失败,请确认中间层加密服务已启动”...
- legend3---OpenSSL SSL_read: SSL_ERROR_SYSCALL, errno 10054
- Leetcode1701. 平均等待时间[C++题解]:模拟题
- jmeter之调度器配置
- Lucene学习总结之七:Lucene搜索过程解析
- c语言用队列stl加头文件,C++ STL List队列用法(实例)
- 【AI独角兽招聘】这里有一个梦,我们一同前往…
- string s=new string() 创建了几个对象_Java的String类5个常见面试题的解答过程和原理...
- 运算符重载 返回类型说明符后加_Python3基础:从独特的角度看运算符重载
- PyTorch自定义CUDA算子教程与运行时间分析
- 程序员计算器HEX、EDC、OCT的意思
- 微带滤波器摘要_微带线带通滤波器设计
- Spring Cloud Alibaba Sentinel(七)受权规则 黑白名单
- XMPP 客户端和服务端
- HCIA-USG Security Policy
- Iphone, Ipad, Iwatch 屏蔽系统更新提示
- 【Clemetine】基于二项Logistic回归的电信客户流失预测
- 量子计算机和超导计算机,量子计算与超导量子计算机.pdf