我相信经过前三篇文章,大家已经学会了怎么下载歌词和歌曲了。看了我的文章后开始行动起来的应该都享受到音乐的福利了。问一个问题,当你疲惫时,你想提起精神来去工作或者看书,你会选择听什么歌曲让自己兴奋起来呢?如果是我,我会听选择摇滚歌曲,节奏感强,歌声高亢。那摇滚歌声究竟在表达什么呢?今天我用 Python 来告诉你。

收集歌词

我用之前文章爬取歌词的方法,爬取了中国一些摇滚歌手的歌词,选取了以下摇滚歌手的歌词:崔健、许巍、郑钧、汪峰、轮回乐队、黑豹乐队、唐朝乐队、窦唯、 高旗&超载乐队、指南针乐队。每位歌手 50 首歌左右,总结收集了 500 首歌的歌词,歌词字数有 12 万多。还不知道怎么用 Python 下载歌词的请戳下面:

以下是 500 首摇滚歌曲的歌词部分截图:

分词

歌词有了,我们直接从文件中读出来,用 jieba 库进行分词。去掉歌词中的空格,去掉作词、作曲等和歌词内容无关的内容。

看下分词后效果,选了汪峰一首歌的部分歌词。分词会把一句话尽可能分成更多的词。

制作图云

接下来把这些词做成词云,选择背景颜色为白色的图片作为背景图片,这样词云的形状才能凸显出来。定义好词云的属性值,用 matplotlib 库把词云图显示出来。话不多说,直接上代码。

我用了 2 张背景图做成了词云图,看下效果图。

摇滚歌手歌词中出现最多的词是我们、自己、世界、所有、生命、希望、寂寞、自由。看来摇滚歌手基本是自信的,他们通过摇滚表达对生命的敬畏,他们对人生充满希望,他们渴望自由的飞翔。

你也可以用上面教的方法去制作其他类型歌曲的词云,赶紧去试试吧。

在我的公众号回复「摇滚」获取全部源码。

python爬歌词生成词云图_Python爬虫摇滚网易云音乐歌词生成词云图相关推荐

  1. python爬虫爬取网易云音乐下载_Python爬虫实践-网易云音乐!没有版权又如何!照样爬取!...

    1.前言 最近,网易的音乐很多听不到了,刚好也看到很多教程,跟进学习了一下,也集大全了吧,本来想优化一下的,但是发现问题还是有点复杂,最后另辟捷径,提供了简单的方法啊! 本文主要参考 python编写 ...

  2. python作业记录--爬虫,网易云音乐热评+词云生成

    import requests import json import re import random from Crypto.Cipher import AES from base64 import ...

  3. python soup歌词_Python 爬虫获取网易云音乐歌手的歌词

    上一篇文章爬取了歌手的姓名和歌手的 id ,这篇文章根据上篇爬取的歌手 id 来直接下载对应歌手的歌词.这些我其实可以写成一个大项目,把这个大项目拆成小项目一来方便大家的理解,二来小项目都会了的话,拼 ...

  4. python网络爬虫网易云音乐_一篇文章带你用Python网络爬虫实现网易云音乐歌词抓取...

    标签下,如下图所示: 接下来我们利用美丽的汤来获取目标信息,直接上代码,如下图: 此处要注意获取ID的时候需要对link进行切片处理,得到的数字便是歌曲的ID:另外,歌曲名是通过get_text()方 ...

  5. 如何利用python爬虫获取网易云音乐某个歌手简介_Python 爬虫获取网易云音乐歌手信息...

    今天就先带大家爬取网易云音乐下的歌手信息并把数据保存下来. 爬取结果 环境 语言:Python 工具:Pycharm 导包 BeautifulSoup:用来解析源码,提取需要的元素. selenium ...

  6. 如何用Python网络爬虫爬取网易云音乐歌词

    前几天小编给大家分享了数据可视化分析,在文尾提及了网易云音乐歌词爬取,今天小编给大家分享网易云音乐歌词爬取方法. 本文的总体思路如下: 找到正确的URL,获取源码: 利用bs4解析源码,获取歌曲名和歌 ...

  7. 利用Python网络爬虫实现对网易云音乐歌词爬取

    今天小编给大家分享网易云音乐歌词爬取方法. 本文的总体思路如下: 找到正确的URL,获取源码: 利用bs4解析源码,获取歌曲名和歌曲ID: 调用网易云歌曲API,获取歌词: 将歌词写入文件,并存入本地 ...

  8. python3爬取网易云歌单数据清洗_如何利用Python网络爬虫爬取网易云音乐歌词

    赵雷的歌曲 本文以民谣歌神赵雷为数据采集对象,专门采集他的歌曲歌词,其他歌手的歌词采集方式可以类推,下图展示的是<成都>歌词. 赵雷歌曲---<成都> 一般来说,网页上显示的U ...

  9. python爬取歌词_利用Python网络爬虫抓取网易云音乐歌词

    今天小编给大家分享网易云音乐歌词爬取方法. 本文的总体思路如下: 找到正确的URL,获取源码: 利用bs4解析源码,获取歌曲名和歌曲ID: 调用网易云歌曲API,获取歌词: 将歌词写入文件,并存入本地 ...

最新文章

  1. c语言数字的拆解_C语言解决变态推理题
  2. golang变量定义细节及beego环境搭建细节记录
  3. c1200 写频软件_摩托罗拉XIR C1200数字对讲机试用——来自HAM族的呼叫
  4. python抽象工厂模式_Python设计模式之抽象工厂模式
  5. DEV GridView嵌套
  6. 78.Subsets
  7. 这才是厉害程序员的标配!
  8. Android设计模式(十五)--备忘录模式
  9. Windows Workflow HOL学习笔记(十二):创建状态基工作流
  10. CURL+preg_match()
  11. C处理Python返回的字串代码
  12. poj1273最大流初破
  13. OpenCV-Python官方文档的查看
  14. Matlab中xtickformat函数
  15. oracle 统计标准误差,标准偏差和标准误差的区别
  16. idea 内存溢出问题
  17. react项目中使用消息订阅(subscribe)-发布(publish)机制
  18. 移动通信技术发展简史:为什么第五次迭代(5G)如此引人瞩目?
  19. Java——一些适合新手练手的Java项目
  20. 计算机能够快速准确,计算机操作练习题

热门文章

  1. 小红书标签怎么添加?小红书标签对作品有什么影响
  2. 学计算机的怎样分析TCGA数据库,开启数据挖掘之门:TCGA数据库入门必看!
  3. 类脑计算芯片作为基础前沿技术重大突破成果,荣登CCTV《新闻联播》
  4. 163邮箱如何登录,在哪可以登录邮箱?
  5. 大型综合网络搭建详细步骤教程
  6. java jzip_JAVA UI 实现ZIP的压缩与解压缩
  7. 大赛来袭 | 千万项目商机+超40W大赛奖金,快来报名吧!
  8. java getday_Date类的getDay()和getDate()方法
  9. 一个pdf怎么分成两个文件?怎样将一个pdf文件分成几个pdf文件或若干个?
  10. python生成测试数据_Python基于Hypothesis测试库生成测试数据