新版即将到来。。。

Introduction

看见有人写了一篇我用Python分析了42万字的歌词,为了搞清楚民谣歌手们在唱些什么,觉得挺好玩的,于是就想自己也实现一下。于是本作品就诞生了。

爬虫

爬虫部分主要是调用已有的 API。这部分的工作可以参考NetEase-MusicBox,该作品作者实现了网易云音乐的命令行版,我用了一下还不错。主要参考了该作者的api.py部分。

文件处理

该部分主要的工作是将所有歌词写入一个文件,同时每个作者的所有歌词也放入一个文件,以备后面的分析之用。

本次获取的歌词大概 26000 行。

文本分析

我首先选取了一位歌手作为代表分析了一下词频,如下所示:

做了一个词云:

然后。把所有的歌词都分析了一下,得到了如下饼状图:

还做了一个词云,如下所示:

接下来的工作

情绪分析

云音乐的评论很精彩,可以做一下评论,看看有什么发现

如何使用

git clone https://github.com/GreatV/CloudMusic-Crawler.git

cd CloudMusic-Crawler

python3 -m venv venv

source venv/bin/activate

pip install -r requirements.txt

cd NEMCrawler

python NEM_spider.py

python text_mining.py

firefox render.html

python网络爬虫网易云音乐guihub_GitHub - GreatV/CloudMusic-Crawler: 网易云音乐爬虫,数据可视化。...相关推荐

  1. Python入门到实战(五)自动化办公、pandas操作Excel、数据可视化、绘制柱状图、操作Word、数据报表生成、pip install国内镜像下载

    Python入门到实战(五)conda使用.pandas操作Excel.数据可视化.绘制柱状图.操作Word.数据报表生成.pip install国内镜像下载 conda使用 常用操作 配置VS+Co ...

  2. Python数据分析初探项目 基于Python数据可视化的网易云音乐歌单分析系统 大学编程作业(TUST 天津科技大学 2022年)

    Python 数据分析初探项目 基于 Python 数据可视化的网易云音乐歌单分析系统 大学编程作业(TUST 天津科技大学 2022 年) Python 数据分析初探项目 基于 Python 数据可 ...

  3. python网络数据爬取及分析_《Python网络数据采集》读后总结--第3章开始爬取数据及天善用户关系分析实例...

    这次介绍一下<Python网络数据采集>这本书的第3章内容(Chpt03.开始爬数据的内容), 使用了天善用户关系分析的示例来介绍一下具体实践. 1.第3章内容简介 1-getWikiLi ...

  4. 【Python实现数据可视化】创建3D柱状图

    虽然matplotlib主要专注于绘图,并且主要是二维的图形,但是它也有一些不同的扩展,能让我们在地理图上绘图,让我们把Excel和3D图表结合起来.在matplotlib的世界里,这些扩展叫做工具包 ...

  5. python内容推荐理由_好书推荐~第5期 | Python 数据可视化

    今天为大家推荐python 数据可视化学习相关的书籍.本书单是笔者经过个人阅读或多个网站书籍对比(当当/亚马逊/豆瓣等)后推荐的书籍. 1.<Python数据可视化之matplotlib实践&g ...

  6. Python商业数据可视化实战

    序 言 目前,互联网全球化.移动设备普及化.物质世界网络化等,都在为"数据大爆发"储蓄能量,大数据已成为继云计算.物联网之后信息产业又一次颠覆性的技术变革.大数据时代正在变革着我们 ...

  7. python网络爬虫网易云音乐_一篇文章带你用Python网络爬虫实现网易云音乐歌词抓取...

    标签下,如下图所示: 接下来我们利用美丽的汤来获取目标信息,直接上代码,如下图: 此处要注意获取ID的时候需要对link进行切片处理,得到的数字便是歌曲的ID:另外,歌曲名是通过get_text()方 ...

  8. Python网络爬虫实践(1):爬取网易云音乐播放量大于1000万的歌单

    Python网络爬虫实践(1) 一.需求分析 爬取网易云音乐播放量大于1000万的歌单. 二.实施步骤 1.安装selenium selenium是一个用于Web应用自动化程序测试的工具,测试直接运行 ...

  9. python网络爬虫网易云音乐下载_python网络爬虫爬取网易云音乐

    #爬取网易云音乐 url="https://music.163.com/discover/toplist" #歌单连接地址 url2 = 'http://music.163.com ...

  10. 手把手教你用Python网络爬虫获取网易云音乐歌曲

    前天给大家分享了用Python网络爬虫爬取了网易云歌词,在文尾说要爬取网易云歌曲,今天小编带大家一起来利用Python爬取网易云音乐,分分钟将网站上的音乐down到本地. 跟着小编运行过代码的筒子们将 ...

最新文章

  1. 文计笔记2: 计算机硬件知识
  2. C语言面向对象编程(四):面向接口编程
  3. 一文详解神经网络与激活函数的基本原理
  4. 转转集团Q4手机行情:二手市场iPhone交易量今年以来首次“反弹”
  5. Linux服务器中解压zip包
  6. 第11月第18天 RACSequence
  7. 关于data.table中i, j, by都为数字的理解
  8. 愚人节的礼物 栈
  9. 【元胞自动机】基于matlab元胞自动机短消息网络病毒传播仿真【含Matlab源码 1289期】
  10. Microsoft Visual Studio .NET 2003 编译xvidcore-1.1.3
  11. Scrapy+MongoDB+FastAPI搭建免费IP代理池接口
  12. django tests 小结
  13. freeswitch呼叫中心之freeswitch集成百度MRCP智能语音
  14. 微信小程序 iOS tableview
  15. 校企联合学院分析ERP在家具行业中的应用
  16. Spring Mvc时间格式参数,前后时间传参,单个字段的时间格式化问题
  17. sfc/scannow检查并修复window系统
  18. 17.AtomicInteger、AtomicBoolean的底层原理
  19. CentOS8 NFS配置部署
  20. npm包管理工具与ES6官方模块化规范

热门文章

  1. 搜c语言题答案软件下载,C语言二级题库软件下载-C语言二级题库官方版下载v1.01-乐游网安卓下载...
  2. 织梦DEDE采集文章标题过短,自带采集标题限制,解决文章标题字数长度方法
  3. Phase2 Day14 Collections RedBlackTree
  4. POJ 3660 Cow Contest(Floyd求传递闭包(可达矩阵))
  5. 深度学习相关软件安装整理
  6. 三星 android驱动安装失败,三星安卓手机usb驱动安装教程
  7. 小米8对一加6打开软件速度测试,小米 8 对决一加 6,谁更值得买?
  8. Junit 单元测试 mybatis
  9. (亲测有效).net framework 在计算机上已安装了更高的 4.x 版本,则无法安装以前的 4.5 版本。
  10. 【bootcamp问答系统部署】