这篇文章主要为大家详细介绍了python 爬取歌曲评论的简单示例,具有一定的参考价值,可以用来参考一下。

感兴趣python 爬取歌曲评论的简单示例的小伙伴,下面一起跟随512笔记的小编罗X来看看吧。

一、抓数据

要想做成词云图表,首先得有数据才行。于是需要一点点的爬虫技巧。

基本思路为:抓包分析、加密信息处理、抓取热门评论信息

1.抓包分析

我们首先用浏览器打开网易云音乐的网页版,进入薛之谦《摩天大楼》歌曲页面,可以看到下面有评论。接着F12进入开发者控制台(审查元素)。

接下来就要做的是,找到歌曲评论对应的url,并分析验证其数据跟网页现实的数据是否吻合

整理思路,分析api并模拟发送请求,获取json解析就好了

2.加密信息处理

然后经过测试,直接把浏览器上这俩数据拿过来就可以。但是要想真正的解决这个加密处理,还需要有点加解密的只是存储

3.抓取热门评论信息

二、数据可视化

在获得相关评论数据后,我们将其做成图表与词云图,将让人看起来更直观。

接下来需要在自己电脑上安装需要相关的安装包: pyecharts(图表包)、matplotlib(绘图功能包)、 WordCloud(词云包)

pyecharts:https://github.com/pyecharts/pyecharts(下载源码解压到python目录cmd进入pyecharts目录输入命令python setup.py install)

WordCloud官网:https://amueller.github.io/word_cloud/index.html

WordCloud下载地址:https://github.com/amueller/word_cloud

其中,pyecharts 是一个用于生成 Echarts 图表的类库。 Echarts 是百度开源的一个数据可视化 JS 库,主要用于数据可视化,同时pyecharts 兼容 Python2 和 Python3

# 512笔记网 (www.512pic.com)

import requests

import json

from pyecharts import Bar

from wordcloud import WordCloud

import matplotlib.pyplot as plt

url = 'http://music.163.com/weapi/v1/resource/comments/R_SO_4_551816010?csrf_token=568cec564ccadb5f1b29311ece2288f1'

headers = {

'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36',

'Referer':'http://music.163.com/#/album?id=38388012',

'Origin':'http://music.163.com',

'Host':'music.163.com'

}

#加密数据,直接拿过来用

user_data = {

'params': 'vRlMDmFsdQgApSPW3Fuh93jGTi/ZN2hZ2MhdqMB503TZaIWYWujKWM4hAJnKoPdV7vMXi5GZX6iOa1aljfQwxnKsNT+5/uJKuxosmdhdBQxvX/uwXSOVdT+0RFcnSPtv',

'encSecKey': '46fddcef9ca665289ff5a8888aa2d3b0490e94ccffe48332eca2d2a775ee932624afea7e95f321d8565fd9101a8fbc5a9cadbe07daa61a27d18e4eb214ff83ad301255722b154f3c1dd1364570c60e3f003e15515de7c6ede0ca6ca255e8e39788c2f72877f64bc68d29fac51d33103c181cad6b0a297fe13cd55aa67333e3e5'

}

response = requests.post(url,headers=headers,data=user_data)

data = json.loads(response.text)

hotcomments = []

for hotcommment in data['hotComments']:

item = {

'nickname':hotcommment['user']['nickname'],

'content':hotcommment['content'],

'likedCount':hotcommment['likedCount']

}

hotcomments.append(item)

#获取评论用户名,内容,以及对应的获赞数

content_list = [content['content'] for content in hotcomments]

nickname = [content['nickname'] for content in hotcomments]

liked_count = [content['likedCount'] for content in hotcomments]

bar = Bar("热评点赞示例图")

bar.add( "点赞数",nickname, liked_count, is_stack=True,mark_line=["min", "max"],mark_point=["average"])

bar.render()

content_text = " ".join(content_list)

wordcloud = WordCloud(font_path=r"C:\simhei.ttf",max_words=200).generate(content_text)

plt.figure()

plt.imshow(wordcloud,interpolation='bilinear')

plt.axis('off')

plt.show()

# End 5.1.2笔记-www.512pic.com

注:关于python 爬取歌曲评论的简单示例的内容就先介绍到这里,更多相关文章的可以留意512笔记的其他信息。

关键词:爬取

python爬取歌曲评论_python 爬取歌曲评论的简单示例相关推荐

  1. python函数名是变量_Python 变量做函数名的简单示例

    这篇文章主要为大家详细介绍了Python 变量做函数名的简单示例,具有一定的参考价值,可以用来参考一下. 对python这个高级语言感兴趣的小伙伴,下面一起跟随512笔记的小编两巴掌来看看吧! PHP ...

  2. python用二分法求平方根_Python使用二分法求平方根的简单示例

    对python这个高级语言感兴趣的小伙伴,下面一起跟随编程之家 jb51.cc的小编两巴掌来看看吧! 使用二分法(Bisection Method)求平方根. # @param 使用二分法(Bisec ...

  3. python爬取虾米音乐_Python爬取620首虾米歌曲,揭秘五月天为什么狂吸粉?!

    最近两天,我被朋友圈的五月天粉丝(五迷)疯狂刷屏,"五月天永远陪你到20岁""演唱会即视感",这些字眼让我恨不得马上奔到电影院打卡. 作为五迷,我是满怀激情地在 ...

  4. python爬取虾米音乐_Python 爬取 620 首虾米歌曲,揭秘五月天为什么狂吸粉?!

    原标题:Python 爬取 620 首虾米歌曲,揭秘五月天为什么狂吸粉?! 来源:Yura不说数据说 作者 :Yura 最近两天,我被朋友圈的五月天粉丝(五迷)疯狂刷屏,"五月天永远陪你到2 ...

  5. python爬携程景区评论_python爬取携程景点评论信息

    python爬取携程景点评论信息 今天要分析的网站是携程网,获取景点的用户评论,评论信息通过json返回API,页面是这个样子的 按下F12之后,F5刷新一下 具体需要URL Request的方式为P ...

  6. python抓取微博评论_Python爬取新浪微博评论数据,你有空了解一下?

    开发工具 Python版本:3.6.4 相关模块: argparse模块: requests模块: jieba模块: wordcloud模块: 以及一些Python自带的模块. 环境搭建 安装Pyth ...

  7. python爬取音乐排行_python爬取网易云音乐热歌榜实例代码

    首先找到要下载的歌曲排行榜的链接,这里用的是: https://music.163.com/discover/toplist?id=3778678 然后更改你要保存的目录,目录要先建立好文件夹,例如我 ...

  8. python爬取豆瓣书籍_python 爬取豆瓣书籍信息

    继爬取 猫眼电影TOP100榜单 之后,再来爬一下豆瓣的书籍信息(主要是书的信息,评分及占比,评论并未爬取).原创,转载请联系我. 需求:爬取豆瓣某类型标签下的所有书籍的详细信息及评分 语言:pyth ...

  9. python爬取大众点评_Python 爬取大众点评 50 页数据,最好吃的成都火锅竟是它!...

    前言 文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者: 胡萝卜酱 PS:如有需要Python学习资料的小伙伴可以加点击下方链 ...

最新文章

  1. vue如何sleep_Java常见面试题 非常实用【个人经验】
  2. C#连接EXCEL数据库
  3. 《数据结构与算法》实验报告——无向图邻接表的构造
  4. html5录音怎么保存到本地,详解HTML5 录音遇到的坑
  5. SQL Server 与 Excel,Access 数据表的导入导出(注:参照博园.NET大观)
  6. thrift java长连接_利用thrift在c++、java和python之间相互调用
  7. 系统学习深度学习(三十八)--深度确定性策略梯度(DDPG)
  8. 《Excel图表之道》学习与阅读启示(一)
  9. Tesseract OCR iOS 教程
  10. 使用nodejs发送电子邮件
  11. L2-016 愿天下有情人都是失散多年的兄妹 (25 分)
  12. CSICTF2020随缘Writeup
  13. 微信扫描普通二维码调起体验版与已发布版的小程序
  14. 解决电脑插耳机声音外放
  15. [附源码]java毕业设计流浪宠物免费领养系统
  16. 6-8.4V自动升降压5V 9V 12V PD快充解决方案 TYPE-C快充
  17. c语言上机题库程序设计,c语言上机程序设计题库及答案.pdf
  18. 论文精读|VRCNet:变分关联点云补全网络(CVPR2021)
  19. 在.NET中操作XmlDocument,XmlReader的方法
  20. Python正则表达式-1

热门文章

  1. SharePoint Designer 2007发布WorkFlow的小bug
  2. Firefox浏览器常见问题开讲
  3. java计算两个文本框的值,java 文本框自动获取另外两个文本框的值的乘积
  4. 适应各个浏览器的iframe高度自动调整
  5. 面向对象分析方法(Object-Oriented Analysis,OOA)
  6. 得到Js文件的绝对路径或相对路径的两法
  7. 高职院校计算机基础课程要求,浅谈高职院校计算机的应用基础课程的改革.doc...
  8. 计算机2级学的是什么时候出来的,2019计算机二级考试科目有哪些 什么时候出成绩...
  9. php sql注入判断,php防止sql注入漏洞过滤函数的代码
  10. 【算法竞赛学习】资金流入流出预测-挑战Baseline_特征工程