python爬取歌曲评论_python 爬取歌曲评论的简单示例
这篇文章主要为大家详细介绍了python 爬取歌曲评论的简单示例,具有一定的参考价值,可以用来参考一下。
感兴趣python 爬取歌曲评论的简单示例的小伙伴,下面一起跟随512笔记的小编罗X来看看吧。
一、抓数据
要想做成词云图表,首先得有数据才行。于是需要一点点的爬虫技巧。
基本思路为:抓包分析、加密信息处理、抓取热门评论信息
1.抓包分析
我们首先用浏览器打开网易云音乐的网页版,进入薛之谦《摩天大楼》歌曲页面,可以看到下面有评论。接着F12进入开发者控制台(审查元素)。
接下来就要做的是,找到歌曲评论对应的url,并分析验证其数据跟网页现实的数据是否吻合
整理思路,分析api并模拟发送请求,获取json解析就好了
2.加密信息处理
然后经过测试,直接把浏览器上这俩数据拿过来就可以。但是要想真正的解决这个加密处理,还需要有点加解密的只是存储
3.抓取热门评论信息
二、数据可视化
在获得相关评论数据后,我们将其做成图表与词云图,将让人看起来更直观。
接下来需要在自己电脑上安装需要相关的安装包: pyecharts(图表包)、matplotlib(绘图功能包)、 WordCloud(词云包)
pyecharts:https://github.com/pyecharts/pyecharts(下载源码解压到python目录cmd进入pyecharts目录输入命令python setup.py install)
WordCloud官网:https://amueller.github.io/word_cloud/index.html
WordCloud下载地址:https://github.com/amueller/word_cloud
其中,pyecharts 是一个用于生成 Echarts 图表的类库。 Echarts 是百度开源的一个数据可视化 JS 库,主要用于数据可视化,同时pyecharts 兼容 Python2 和 Python3
# 512笔记网 (www.512pic.com)
import requests
import json
from pyecharts import Bar
from wordcloud import WordCloud
import matplotlib.pyplot as plt
url = 'http://music.163.com/weapi/v1/resource/comments/R_SO_4_551816010?csrf_token=568cec564ccadb5f1b29311ece2288f1'
headers = {
'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36',
'Referer':'http://music.163.com/#/album?id=38388012',
'Origin':'http://music.163.com',
'Host':'music.163.com'
}
#加密数据,直接拿过来用
user_data = {
'params': 'vRlMDmFsdQgApSPW3Fuh93jGTi/ZN2hZ2MhdqMB503TZaIWYWujKWM4hAJnKoPdV7vMXi5GZX6iOa1aljfQwxnKsNT+5/uJKuxosmdhdBQxvX/uwXSOVdT+0RFcnSPtv',
'encSecKey': '46fddcef9ca665289ff5a8888aa2d3b0490e94ccffe48332eca2d2a775ee932624afea7e95f321d8565fd9101a8fbc5a9cadbe07daa61a27d18e4eb214ff83ad301255722b154f3c1dd1364570c60e3f003e15515de7c6ede0ca6ca255e8e39788c2f72877f64bc68d29fac51d33103c181cad6b0a297fe13cd55aa67333e3e5'
}
response = requests.post(url,headers=headers,data=user_data)
data = json.loads(response.text)
hotcomments = []
for hotcommment in data['hotComments']:
item = {
'nickname':hotcommment['user']['nickname'],
'content':hotcommment['content'],
'likedCount':hotcommment['likedCount']
}
hotcomments.append(item)
#获取评论用户名,内容,以及对应的获赞数
content_list = [content['content'] for content in hotcomments]
nickname = [content['nickname'] for content in hotcomments]
liked_count = [content['likedCount'] for content in hotcomments]
bar = Bar("热评点赞示例图")
bar.add( "点赞数",nickname, liked_count, is_stack=True,mark_line=["min", "max"],mark_point=["average"])
bar.render()
content_text = " ".join(content_list)
wordcloud = WordCloud(font_path=r"C:\simhei.ttf",max_words=200).generate(content_text)
plt.figure()
plt.imshow(wordcloud,interpolation='bilinear')
plt.axis('off')
plt.show()
# End 5.1.2笔记-www.512pic.com
注:关于python 爬取歌曲评论的简单示例的内容就先介绍到这里,更多相关文章的可以留意512笔记的其他信息。
关键词:爬取
python爬取歌曲评论_python 爬取歌曲评论的简单示例相关推荐
- python函数名是变量_Python 变量做函数名的简单示例
这篇文章主要为大家详细介绍了Python 变量做函数名的简单示例,具有一定的参考价值,可以用来参考一下. 对python这个高级语言感兴趣的小伙伴,下面一起跟随512笔记的小编两巴掌来看看吧! PHP ...
- python用二分法求平方根_Python使用二分法求平方根的简单示例
对python这个高级语言感兴趣的小伙伴,下面一起跟随编程之家 jb51.cc的小编两巴掌来看看吧! 使用二分法(Bisection Method)求平方根. # @param 使用二分法(Bisec ...
- python爬取虾米音乐_Python爬取620首虾米歌曲,揭秘五月天为什么狂吸粉?!
最近两天,我被朋友圈的五月天粉丝(五迷)疯狂刷屏,"五月天永远陪你到20岁""演唱会即视感",这些字眼让我恨不得马上奔到电影院打卡. 作为五迷,我是满怀激情地在 ...
- python爬取虾米音乐_Python 爬取 620 首虾米歌曲,揭秘五月天为什么狂吸粉?!
原标题:Python 爬取 620 首虾米歌曲,揭秘五月天为什么狂吸粉?! 来源:Yura不说数据说 作者 :Yura 最近两天,我被朋友圈的五月天粉丝(五迷)疯狂刷屏,"五月天永远陪你到2 ...
- python爬携程景区评论_python爬取携程景点评论信息
python爬取携程景点评论信息 今天要分析的网站是携程网,获取景点的用户评论,评论信息通过json返回API,页面是这个样子的 按下F12之后,F5刷新一下 具体需要URL Request的方式为P ...
- python抓取微博评论_Python爬取新浪微博评论数据,你有空了解一下?
开发工具 Python版本:3.6.4 相关模块: argparse模块: requests模块: jieba模块: wordcloud模块: 以及一些Python自带的模块. 环境搭建 安装Pyth ...
- python爬取音乐排行_python爬取网易云音乐热歌榜实例代码
首先找到要下载的歌曲排行榜的链接,这里用的是: https://music.163.com/discover/toplist?id=3778678 然后更改你要保存的目录,目录要先建立好文件夹,例如我 ...
- python爬取豆瓣书籍_python 爬取豆瓣书籍信息
继爬取 猫眼电影TOP100榜单 之后,再来爬一下豆瓣的书籍信息(主要是书的信息,评分及占比,评论并未爬取).原创,转载请联系我. 需求:爬取豆瓣某类型标签下的所有书籍的详细信息及评分 语言:pyth ...
- python爬取大众点评_Python 爬取大众点评 50 页数据,最好吃的成都火锅竟是它!...
前言 文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: 胡萝卜酱 PS:如有需要Python学习资料的小伙伴可以加点击下方链 ...
最新文章
- vue如何sleep_Java常见面试题 非常实用【个人经验】
- C#连接EXCEL数据库
- 《数据结构与算法》实验报告——无向图邻接表的构造
- html5录音怎么保存到本地,详解HTML5 录音遇到的坑
- SQL Server 与 Excel,Access 数据表的导入导出(注:参照博园.NET大观)
- thrift java长连接_利用thrift在c++、java和python之间相互调用
- 系统学习深度学习(三十八)--深度确定性策略梯度(DDPG)
- 《Excel图表之道》学习与阅读启示(一)
- Tesseract OCR iOS 教程
- 使用nodejs发送电子邮件
- L2-016 愿天下有情人都是失散多年的兄妹 (25 分)
- CSICTF2020随缘Writeup
- 微信扫描普通二维码调起体验版与已发布版的小程序
- 解决电脑插耳机声音外放
- [附源码]java毕业设计流浪宠物免费领养系统
- 6-8.4V自动升降压5V 9V 12V PD快充解决方案 TYPE-C快充
- c语言上机题库程序设计,c语言上机程序设计题库及答案.pdf
- 论文精读|VRCNet:变分关联点云补全网络(CVPR2021)
- 在.NET中操作XmlDocument,XmlReader的方法
- Python正则表达式-1
热门文章
- SharePoint Designer 2007发布WorkFlow的小bug
- Firefox浏览器常见问题开讲
- java计算两个文本框的值,java 文本框自动获取另外两个文本框的值的乘积
- 适应各个浏览器的iframe高度自动调整
- 面向对象分析方法(Object-Oriented Analysis,OOA)
- 得到Js文件的绝对路径或相对路径的两法
- 高职院校计算机基础课程要求,浅谈高职院校计算机的应用基础课程的改革.doc...
- 计算机2级学的是什么时候出来的,2019计算机二级考试科目有哪些 什么时候出成绩...
- php sql注入判断,php防止sql注入漏洞过滤函数的代码
- 【算法竞赛学习】资金流入流出预测-挑战Baseline_特征工程