如何解析网页就不介绍了,可以参考:
https://blog.csdn.net/Monkey_D_Newdun/article/details/79318629
直接上代码~

刚刚突然听到一首老歌,SHE的《听袁惟仁弹吉他》,就爬这首的评论吧~这首歌的ID是375095

1. 抓取热门评论内容

import requests
import jsondef getcomments(musicid):url = 'http://music.163.com/weapi/v1/resource/comments/R_SO_4_{}?csrf_token='.format(musicid) #{}内为自定义函数getcomments(musicid)的参数,由用户输入的payload = {'params': 'wh0V9MEwF+aU+XzfrIzcIoovOzMVYAvnNssWEvw2P3C3euuqtzZfo8OJYlZoZ/kE0aAgMBQtvPY2J2MoGVYnIG6FpuAekLc4u4YgjbvPh8GjHqDB7KmIsf0Q87LoSDmq3gXHCEwMPot2CtJae9Uc9d5mDofHna0sKtUH1Z6Cwhp1lynlsm230WNBLdV9TlDn','encSecKey': '0d215e8c122017f2ed2f5d298f0f45aa6f7d59300a655402ded380fd4f1200b34be31cef810ec42639d2f9b33f2a8ffd061873d3faf6d14b1dfd111b0714e175d6f829b7657936adbae8b6c8d46bede24e2266949cfac10f234b1614ec980cf05a22be477d1ce56e87578ec09a47e4cf5f9e23184c354e46afbd49175a9f449d'}headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_4) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/11.1 Safari/605.1.15','Referer': 'http://music.163.com/song?id={}'.format(musicid),'Host': 'music.163.com','Origin': 'http://music.163.com'}response = requests.post(url=url, headers=headers, data=payload)data = json.loads(response.text)hotcomments = []for hotcomment in data['hotComments']:item = {'nickname': hotcomment['user']['nickname'], #昵称'content': hotcomment['content'] #评论} #item是一个字典hotcomments.append(item) #hotcomments是一个list# 返回热门评论return [content['content'] for content in hotcomments] #拆分成两步:for content in 列表hotcomments #第一步:列表的元素是字典,取出其中的一个字典content对应的内容,也就是content['content'] #第二步:将这个字典content加上[]变成列表if __name__ == '__main__':hot = getcomments(375095)print(hot) #hot是一个list

note: 列表中存储字典的用法可以参考: http://www.cnblogs.com/AaronFan/p/6057264.html

2. 热门评论保存到本地txt

file=open('/Users/ycy/Desktop/hotcomment_contents.txt','w')
file.write(str(hot)) #write() argument must be str, not list
file.close()

3. 读取txt内容并结巴分词

text = open(r'/Users/ycy/Desktop/hotcomment_contents.txt',"r").read()import matplotlib.pyplot as plt     #数学绘图库
import jieba               #分词库
from wordcloud import WordCloud   #词云库#默认精确模式。可以添加自定义词典userdict.txt,然后jieba.load_userdict(file_name) ,file_name为文件类对象或自定义词典的路径
# 自定义词典格式和默认词库dict.txt一样,一个词占一行:每一行分三部分:词语、词频(可省略)、词性(可省略),用空格隔开,顺序不可颠倒cut_text= jieba.cut(text)
result= "/".join(cut_text)#必须给个符号分隔开分词结果来形成字符串,否则不能绘制词云
print(result)

4. 生成词云图

wc_1 = WordCloud(font_path=r"System/Library/Fonts/STHeiti Medium.ttc",max_font_size=50)#,min_font_size=10)#,mode='RGBA',colormap='pink')
wc_1.generate(result)
wc_1.to_file(r"/Users/ycy/Desktop/hotcomment_contents.png")from matplotlib.font_manager import FontPropertiesfont = FontProperties(fname="/Library/Fonts/Songti.ttc")
plt.title(u"词云图", fontproperties=font) #指定所绘图名称
#plt.title(u"按年龄看获救分布 (1为获救)", fontproperties=font)
plt.imshow(wc_1)       # 以图片的形式显示词云
plt.axis("off")      #关闭图像坐标系
plt.show()

最后得到的词云图如下:

抓取网易云音乐歌曲热门评论生成词云相关推荐

  1. 抓取网易云音乐歌曲热门评论生成词云(转)

    非原创作品,转载自:http://blog.csdn.net/marksinoberg/article/details/70809830 前言 网易云音乐一直是我向往的"神坛",听 ...

  2. python爬虫网易云音乐最热评论并分析_Python3实现爬虫抓取网易云音乐的热门评论分析(图)...

    这篇文章主要给大家介绍了关于Python3实战之爬虫抓取网易云音乐热评的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧. ...

  3. python爬虫网易云音乐评论最多的歌_Python3实战之爬虫抓取网易云音乐的热门评论...

    前言 之前刚刚入门python爬虫,有大概半个月时间没有写python了,都快遗忘了.于是准备写个简单的爬虫练练手,我觉得网易云音乐最优特色的就是其精准的歌曲推荐和独具特色的用户评论,于是写了这个抓取 ...

  4. 带你写爬虫(python)第二篇----抓取网易云音乐下面的评论(API方式)

    抓取网易云音乐<大学无疆>的评论 一直喜欢使用网易云音乐,网易云歌曲下面的评论给其加分不少,所以这一篇来写一下怎么抓取歌曲下面的评论. 准备工作 目标网页:http://music.163 ...

  5. 用python爬取网易云评论最多的歌_巧用Python爬取网易云音乐歌曲全部评论

    一.首先分析数据的请求方式 网易云音乐歌曲页面的URL形式为https://music.163.com/#/song?id=歌曲id号,这里我用Delacey的Dream it possible 为例 ...

  6. Python3爬虫抓取网易云音乐热评实战

    前一段时间刚刚入门python爬虫,有大概半个月时间没有写python了,都快遗忘了.于是准备写个简单的爬虫练练手,我觉得网易云音乐最优特色的就是其精准的歌曲推荐和独具特色的用户评论,于是写了这个抓取 ...

  7. 使用爬虫抓取网易云音乐热门评论生成好玩的词云

    互联网爬虫是一个很有意思的技术,借由爬虫,我们可以做到很多好玩的事情--这其中就包括爬取评论. 词云就是个更好玩的技术,通过技术方法分析词语出现频率,生成可视化的图形,将文字内容用图形呈现,想想就很意 ...

  8. python3爬取网易云歌单数据清洗_网页抓取网易云音乐及评论数据分析

    网页抓取网易云音乐及评论数据分析 游贤 成都理工大学信息科学与技术学院 [摘 要] 摘要:为了分析网易云音乐中哪些歌曲是热门歌曲,哪些歌曲的评论 最多,从而了解到人们对于不同音乐类型的喜爱程度,采用成 ...

  9. python音乐的数据抓取与分析_python抓取网易云音乐热评做词图数据分析

    最近就有一部"怀旧"题材的电影,未播先火,那就是刘若英的处女作--<后来的我们>.青春,爱情,梦想,一直是"怀旧"题材的核心要素,虽然电影现在还未上 ...

  10. Python抓取网易云音乐热搜榜热评

    引子 啊~最有个小姐姐要做微信公众号,她需要优质的句子.文章,于是我想到了网易云每首伤感歌曲下面的评论,嗯~很感人,甚至有的时候真的感觉这里就是能触及我心灵最柔软的地方,正好这几天在学习python, ...

最新文章

  1. mysql slave 详细配置_进击的MysqlSlave环境搭建及配置
  2. 静态程序分析chapter5 - 常量传播分析上(Costant Propagation Analysis)
  3. Django ModelForm 组件的应用
  4. transform的q、k、v的计算过程
  5. 【PAT】1002 写出这个数
  6. 全向轮运动特性分析(图片版)
  7. 路孚特:金融行业数据复杂 成本高 难获取 看路孚特如何打破困局
  8. xamarin android 设备,【Xamarin.Android】在Visual Studio中增强设备日志记录
  9. 计算机学报范文,计算机学报论文
  10. Zabbix错误:zbx_mem_malloc(): out of memory的解决方法
  11. XP系统最大能支持多少内存
  12. 【HTML】网页开发的一些单词(关键词),新手必备。
  13. java 求和、差、乘、商
  14. 阿里云张振尧:阿里云边缘云驱动5G时代行业新价值
  15. 服务器固态盘和机械盘哪个好
  16. 【Go】解析X509
  17. 强大的grep用法详解:grep与正则表达式
  18. JavaScript --函数 (实例结合)
  19. 24.Odoo产品分析 (三) – 人力资源板块(5) – 出勤(1)
  20. DedeCMS-Dede伪原创自动采集发布

热门文章

  1. 【未解决】【Linux环境】IDEA下搜狗输入法无法光标跟随
  2. 如何在Mac OS X中使用GeekTool设置桌面任务清单
  3. Chrome OS上的Android系统
  4. html项目答辩ppt范文,论文答辩ppt 论文ppt答辩模板|论文答辩ppt范文6页
  5. 对龙果支付系统的简单了解
  6. python打开浏览本地html文件_python解析本地HTML文件
  7. java 生成随机数 (Random函数)
  8. Access2016学习4
  9. 海贝思蓝牙接收器Linux,Hagibis海备思 蓝牙音频接收 耳机怎么样,评测
  10. 完美解决VS2003.Net fatal error LNK1201: 写入程序数据库“.pdb”时出错我的开发环境是Win7旗舰64位+VS2003.Net,经常卡pdb错误,文末给出一个完美的解决