使用Python将《青花瓷》歌词生成词云图
哈喽大家好,因为上次有小伙伴问我,歌曲的歌词和评论怎么生成词云图,想买代码…
当时我就拒绝了,直接免费送给了他。
所以今天来分享给大家
我们以周董的《青花瓷》为例,要对《青花瓷》歌词生成词云图,需要采取以下步骤:
- 安装所需的库
要完成该任务,需要安装 jieba
和 wordcloud
库。可以在命令行下输入以下代码进行安装:
pip install jieba wordcloud
- 获取歌词数据
将周杰伦《青花瓷》歌词数据保存为文本文件,并将其读取到 Python
程序中。可以使用 Python
的文件操作等方法获得文本文件数据,例如:
with open('qhc.txt', 'r', encoding='utf-8') as f:lyrics = f.read()
- 分词
使用 jieba
库进行中文分词,将歌词文本数据分解为一个个单词,统计每个单词的词频。
import jiebalyrics = jieba.cut(lyrics)
word_freq = {}
for word in lyrics:if len(word) > 1:word_freq[word] = word_freq.get(word, 0) + 1
- 生成词云
使用 wordcloud
库生成词云图并将其保存到本地。
from wordcloud import WordCloud
import matplotlib.pyplot as pltwc = WordCloud(background_color='white', width=800, height=600)
wc.generate_from_frequencies(word_freq)
plt.imshow(wc)
plt.axis('off')
plt.show()# 将生成的词云保存为图片文件
wc.to_file('qhc_wordcloud.png')
完整代码如下所示:
import jieba
from wordcloud import WordCloud
import matplotlib.pyplot as plt# 读取歌词
with open('qhc.txt', 'r', encoding='utf-8') as f:lyrics = f.read()# 分词并计算词频
lyrics = jieba.cut(lyrics)
word_freq = {}
for word in lyrics:if len(word) > 1:word_freq[word] = word_freq.get(word, 0) + 1# 生成词云并展示
wc = WordCloud(background_color='white', font_path='msyh', width=800, height=600)
wc.generate_from_frequencies(word_freq)
plt.imshow(wc)
plt.axis('off')
plt.show()# 将生成的词云保存为图片文件
wc.to_file('qhc_wordcloud.png')
运行该代码后,会生成包含《青花瓷》歌词词云图的图片并保存到本地。需要注意的是,由于分词的准确性和歌词长度等因素的影响,该词云图可能需要经过调整和优化。
效果展示
对于想学好Python的小伙伴,我还准备了
Python软件工具+数百本Python电子书+Python基础教程+Python实战教程
直接在文末名片自取
图片不能发多了,仅做展示。
好了今天的分享就到这结束了,下次见!
使用Python将《青花瓷》歌词生成词云图相关推荐
- python爬取歌词生成词云图_爬取毛不易歌词作词云展示
爬取毛不易歌词作词云展示 今天我们做一个数据可视化的项目,爬取毛不易的歌词做词云展示. 1.爬取数据 我们主要使用 Python 爬虫获取 HTML,用 XPath 对歌曲的 ID.名称进行解析,然后 ...
- 用Python将《青花瓷》的歌词生成词云图
前言 大家早好.午好.晚好吖 ❤ ~欢迎光临本文章 因为上次有小伙伴问我,歌曲的歌词和评论怎么生成词云图,想买代码- 当时我就拒绝了,直接免费送给了他. 所以今天来分享给大家 我们以周董的<青花 ...
- python爬音乐评论生成词云图_python爬虫+词云图,爬取网易云音乐评论
又到了清明时节,用python爬取了网易云音乐<清明雨上>的评论,统计词频和绘制词云图,记录过程中遇到一些问题 爬取网易云音乐的评论 一开始是按照常规思路,分析网页ajax的传参情况.看到 ...
- Python | 根据指定文件生成词云图
任务:编写程序,编好后,把多个文本文件(中文.英文或中英文语言混合的文本文件,编码格式为UTF-8,扩展名为txt)放到程序所在目录.程序运行时,能把程序所在目录下所有文本文件找出来,并显示出文件基本 ...
- python爬歌词生成词云图_Python爬虫摇滚网易云音乐歌词生成词云图
我相信经过前三篇文章,大家已经学会了怎么下载歌词和歌曲了.看了我的文章后开始行动起来的应该都享受到音乐的福利了.问一个问题,当你疲惫时,你想提起精神来去工作或者看书,你会选择听什么歌曲让自己兴奋起来呢 ...
- python网易云歌词做成词云图_讨好女朋友:用Python给女朋友做一个歌曲词云图
今天咋们来看看网易云赵雷的歌曲歌词,并做一个词云图.这篇文章可以学习到什么是词云,爬虫的基本流程,简单的可视化操作 一 什么是词云 可视化有很多种,好的数据可视化,可以使得数据分析的结果更加通俗易通. ...
- Python WordCloud 文本分析 生成词云图
文章目录 环境准备 Code 结果文件 Links 环境准备 Python, pip安装配置: 安装依赖的包(使用-i url指定要使用的镜像源,加快下载速度) pip install wordclo ...
- python网易云歌词做成词云图_Python爬取李荣浩最短歌曲贝贝的网易云评论并做成词云图...
前言 在18 年的 10 月 17 号,李荣浩发了一张新专辑「耳朵」,专辑里有一首歌「贝贝」,只有 4 秒,歌词也就两个字.而且这首歌的作曲 .作词 .编曲.制作人.和声.录音师.混音师.录音室.混音 ...
- python 统计文本字数 生成词云图
程序采用wordcloud.jieba分词.matplotlib绘制图像的模块 02.py # 题目二 # 请你设计一个统计字数的工具,工具要求如下: # 1.统计的是任意文本文件(txt)内容的字数 ...
最新文章
- linux安装硬盘命令,硬盘安装linux的两条命令
- 开源Vue表格组件,表格插件源码
- 使用MySql保存session
- riak文件服务器,Docker中运行Riak服务 - Docker 中文指南
- 【OpenCV】透视变换 Perspective Transformation(续)
- MessageBox、::MessageBox 、AfxMessageBox三者的区别
- [转]js判断url是否有效
- java正则表达式非贪婪_正则表达式中的贪婪与非贪婪匹配模式
- Unity AudioMixer效果器设置
- 魔兽世界单机服务器物品查询,魔兽世界单机版gm命令-物品代要码大全.doc
- AGV机器人核心部件——驱动轮
- ubuntu 18.04 安装谷歌输入法
- (原创)如何将Nios II硬件和软件合成一个文件(NIOS II)(硬件)(软件)(合并)...
- Parallel GC
- 一个电脑白痴和一个黑客的超爆笑的对话
- 移动硬盘位置不可用参数错误的解决方法
- [VCS]后仿真中的几个基本概念
- MATLAB画哆啦A梦
- 《Vue3+TS》开发一个自己的起始页
- 安装scrapy报错failed with error code 1 in C:\Users\ADMINI~\AppData\Local\Temp\pip-install-4447ozxq\Twist
热门文章
- 小心!显卡BIOS刷新工具Nvflash变杀手
- Spring学习(2)-程序间耦合和工厂模式解耦
- 启动时隐藏窗口及恢复
- TVS瞬态电压抑制二极管原理
- mysql .net orm_目前的.NET(C#)世界里,主流的ORM框架
- Reactor 3 (10): 数据合并concat、merge
- 如何开发一个人人爱的组件?
- 什么是网络终端,这个“终端”是什么意思?
- 室外LED显示器烧板失效分析
- Quartz动态改变Cron表达式,来实现动态执行Spring定时任务