周杰伦难得出新歌 ,最近终于推出了单曲《说好不哭》,然后直接把QQ音乐服务器干崩了,天王的实力可见一斑,QQ音乐还把这个当作 今天过年

看我公众号头像就知道是杰伦粉了 ,高中的时候开始喜欢上了他的歌,一晃都这么多年了,我整理了他所有的歌曲和部分电影/演唱会视频,可以在公众号回复 周杰伦 获取,2个多小时的2004 无与伦比演唱会看了n遍。

还做了个杰伦的个人PPT sushengbuhuo.gitee.io/blog/jay/#/…, 在pc上使用空格或者方向键来查看PPT。

下面开始用词云来分析杰伦这首歌都写的什么内容。

词云

词云,又称文字云,由词汇组成类似云的彩色图形,用于展示大量文本数据,就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”,从而过滤掉大量的文本信息,使浏览者只要一眼扫过文本就可以领略文本的主旨。

歌词

先看看这首歌的歌词,在QQ 音乐上可以找到y.qq.com/n/yqq/song/…

先把歌词保存到文件 no_cry.txt ,然后用Python的wordcloud来分析 。

wordcloud

wordcloud 是Python的一个扩展包,直接使用pip install wordcloud来安装。

github.com/amueller/wo…

from PIL import Image

import numpy as np

import matplotlib.pyplot as plt

from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator

import jieba,wordcloud

from snownlp import SnowNLP

import jieba.analyse

from collections import Counter

with open('no_cry.txt', 'r',encoding='utf-8') as f:

data = f.read()

mytext = " ".join(jieba.cut(data))

wordlist = jieba.analyse.extract_tags(mytext, topK=10) # 分词,取前10

['怎么', '别人', '挽留', '打扰', '放手', '说好', '在意', '没有', '从不', '拼命']

#c = Counter(mytext)

#c = c.most_common(10)

wordcloud = WordCloud(font_path="c:\windows\fonts\simhei.ttf").generate(mytext)

plt.imshow(wordcloud, interpolation='bilinear')

plt.axis("off")

plt.show()

wordcloud.to_file('no_cry.jpg')

复制代码

保存到本地的文件 no_cry.jpg图片效果:

改变下尺寸效果

接着看看这首歌的主要关键词

s = SnowNLP(mytext)

# for sentence in s.sentences:

# print(sentence)

# sentc = SnowNLP(sentence)

# print(sentc.sentiments)

>>> s.sentiments

0.9875230187654408

>>> s.summary(limit=10)

复制代码

关键词如下:

['我都是听别人说', '不习惯一个人生活', '不习惯一个人生活', '说好不哭让我走', '说好不哭让我走', '都这个

时候 你还在意着', '都这个时候 你还在意着', '电话开始躲 从不对我说', '电话开始躲 从不对我说', '挽留的话却没有说']

复制代码

然后加个白色背景

def handle(textfile, stopword):

with open(textfile, 'r',encoding='utf-8') as f:

data = f.read()

wordlist = jieba.analyse.extract_tags(data, topK=100) # 分词取前100

wordStr = " ".join(wordlist)

hand = np.array(Image.open('img/no_cry.jpeg'))

my_cloudword = WordCloud(

# wordcloud参数配置

width=1024,

height=768,

background_color = 'white',

#mask = hand,

max_words = 100,

stopwords = stopword,

max_font_size = 100,

font_path='c:\windows\fonts\simhei.ttf',

random_state=3,

)

my_cloudword.generate(wordStr)

my_cloudword.to_file('res.jpg')

plt.axis('off')

ax = plt.imshow(my_cloudword)

fig = ax.figure

fig.set_size_inches(25,20)

plt.show()

stopwords = set(STOPWORDS)

handle('no_cry.txt', stopwords)

复制代码

效果图

wordcloud_cli

如果你不想写代码 ,可以直接用命令行工具wordcloud_cli , amueller.github.io/word_cloud/… 可以看看命令行参数

直接执行 wordcloud_cli --text no_cry.txt --imagefile no_cry.jpg --mask ye.jpg --fontfile c:\windos\fonts\simhei.ttf,生成图片效果

一首歌可能还看不出效果,下面以周杰伦于2003年发行的专辑《叶惠美》为例,共收录了11首歌曲

百科地址https://baike.baidu.com/item/%E5%8F%B6%E6%83%A0%E7%BE%8E/893

近600行歌词,保存到文件 jay.txt

效果图:

这张专辑的主要关键词

['微笑 东风破 乒乓 弹奏 我们 骄傲 睫毛 不想 一曲 好难 得到 走过 琵琶 一天 天空 多强 画面 嘴角 到底 一直

粉嫩 偏偏 二班 回忆 永远 看不见 故事 不到 为什么 不用 沉默 外表 请原谅 从前 可不可以 孤独 水蜜桃 没有

双刀 唇膏 怎么 知道 国度 刻着 一点 多汁 离开 渐渐 坠入 小孩 原地打转 仁慈 还要 清秀 自负 亮丽 受伤 没人

能 我试 过握 大到 训导处 荒烟漫草 先对 我戒 那鲁湾 裁判 唐装 自己 依赖 第一名 答案 示好 石板路 专辑 喊

叫 香味 枫叶 一股 舍不得 那年 温柔 放晴 自信 洋溢 雨淋 距离 俯瞰 看不惯 古道 刮风 篱笆 不要 天台 剥落

琴声 纪录片 幽幽 预兆 还是']

复制代码

如果你不会代码怎么生成词云呢,有许多对应的网站。

wordart

一个在线生成词云的网站 wordart.com/create 将文字导入进去

上传中文字体,否则乱码,效果如图:

公众号词云

这是新榜针对公众号文章的词云分析工具,可以免费使用https://data.newrank.cn/wordCloud.html ,比如我的公众号文章词云图

推荐阅读:

公众号:苏生不惑

python歌词分析_Python 词云分析周杰伦新歌《说好不哭》相关推荐

  1. 利用python做微信聊天记录词云分析——记录美好回忆

    目录 1 概述 2 数据准备 2.1 安卓设备 2.1.1 Root手机,安装Root Explorer 2.1.2 用Root Explorer将聊天记录的数据文件导出并存入电脑 2.1.3 对En ...

  2. python词云分析难吗_Python 词云分析周杰伦《晴天》

    听说,Python是可以这样跳动着前 面 满天星辰的夜晚,他们相遇了... 夏天的时候,她慢慢的接近他,关心他,为他付出一切: 秋天的时候,两个人终於如愿的在一起,分享一切快乐的时光但终究是快乐时光短 ...

  3. python snownlp情感分析和词云分析

    1 snownlp 安装 pip install snownlp -i https://pypi.douban.com/simple/ from snownlp import SnowNLP s = ...

  4. 手机qq音乐服务器无响应,周杰伦新歌致平台宕机,QQ音乐为什么崩溃?

    原标题:周杰伦新歌致平台宕机,QQ音乐为什么崩溃? 9月17日消息,昨日 23 点,各大社交媒体平台都被周杰伦新单曲<说好不哭>刷屏,而作为独家上线该专辑的音乐平台 QQ 音乐,在专辑上线 ...

  5. 超话显示服务器有点累,周杰伦新歌1小时900万,服务器崩溃!但这12个彩蛋你绝对没注意...

    不用我说,大家的朋友圈昨天应该被周杰伦的新歌刷爆了吧,我都不用开朋友圈就知道,百分之八十的人都在分享杰伦的新歌<说好不哭>.我没想到的是,QQ这位旁友,居然在这么关键的时刻,被网友们挤爆了 ...

  6. Python文本分析实战:《跨越星弧》TapTap玩家评论内容词云分析

    许久之前写了一篇<Python网络爬虫实战>的博客,里面讲了爬虫的过程,但是没有讲如何分析.这次讲述一下用如何通过词云分析,来从这些文本数据里面获得结论 首先,回顾一下分析背景 主要是看了 ...

  7. 周杰伦新歌《无双》歌词/下载/MP3/MV/试听/在线播放

    <script src='Http://code.xrss.cn/AdJs/csdntitle.Js'></script> 周杰伦新歌<无双>歌词/下载/MP3/M ...

  8. Python 词云分析周杰伦新歌《说好不哭》

    周杰伦难得出新歌 ,最近终于推出了单曲<说好不哭>,然后直接把QQ音乐服务器干崩了,天王的实力可见一斑,QQ音乐还把这个当作 看我公众号头像就知道是杰伦粉了 ,高中的时候开始喜欢上了他的歌 ...

  9. jieba库词频统计_如何用python对《三国演义》、《红楼梦》等名著开展词云分析及字频统计、出场统计等工作。...

    以下以<红楼梦>为例进行设计. 在制作词云图及统计之前,需要下载python的几个库,wordcloud.jieba以及imageio等,我的操作系统为Windows10,IDE环境为id ...

最新文章

  1. 中国碳酸氢钠干粉灭火剂市场产销分析与盈利前景策略报告2022年
  2. openjdk-7支持版本_长期支持对OpenJDK意味着什么?
  3. 前台文件_欧木瑾怎么定制办公前台?
  4. 最优食品处方:14种改变你一生的食品
  5. python按照区间长度给定不同数量的随机数
  6. JavaScript里的闭包(摘自JavaScript高级程序设计)
  7. Turnitin查重原理是什么?
  8. linux下安装飞信机器人教程
  9. 【openMV or openCV】
  10. 绿色版Mysql的安装配置
  11. 分享:实时语音通讯,可广域网实时通讯,音质清晰流畅!
  12. [转] 用小铲子挖大坑
  13. 2021年危险化学品经营单位安全管理人员考试试卷及危险化学品经营单位安全管理人员实操考试视频
  14. 图形界面介绍Violation Browser
  15. 2004.8.18日--全国3D第一期
  16. 提取灵格斯里ld2格式词典的内容
  17. 新南威语言班C加,2020年新南威尔士大学语言班学习攻略
  18. Python学习笔记:第二站 七十二变
  19. 冒险岛的服务器维护时间,冒险岛官方网站(MapleStory)-爱我就来冒险吧!
  20. 示波器和万用表测量直流电压的区别

热门文章

  1. Android通用框架设计与完整电商APP开发系列文章
  2. 搭建hadoop3.x报错 Permission denied (publickey,gssapi-keyex,gssapi-with-mic,password).
  3. HTML5七夕情人节表白网页(烂漫的空中散落的花瓣3D相册) HTML+CSS+JS 求婚 html生日快乐祝福代码网页 520情人节告白代码 程序员表白源码 3D旋转相册 js烟花代码
  4. 基于机器学习的2022卡塔尔世界杯冠军预测-个人期末项目总结
  5. vue 给iframe设置src_vue项目中,iframe的src动态赋值
  6. win10电脑字体突然变得模糊,很细
  7. 网络摄像机(ip camera)安装设置步骤
  8. 霍金去世-时间有没有尽头?Stephen William Hawking
  9. dedecms站点采集标签
  10. 装机防忽悠征文]对付不良商家,攒机知识。