python网络爬虫网易云音乐guihub_GitHub - GreatV/CloudMusic-Crawler: 网易云音乐爬虫,数据可视化。...
新版即将到来。。。
Introduction
看见有人写了一篇我用Python分析了42万字的歌词,为了搞清楚民谣歌手们在唱些什么,觉得挺好玩的,于是就想自己也实现一下。于是本作品就诞生了。
爬虫
爬虫部分主要是调用已有的 API。这部分的工作可以参考NetEase-MusicBox,该作品作者实现了网易云音乐的命令行版,我用了一下还不错。主要参考了该作者的api.py部分。
文件处理
该部分主要的工作是将所有歌词写入一个文件,同时每个作者的所有歌词也放入一个文件,以备后面的分析之用。
本次获取的歌词大概 26000 行。
文本分析
我首先选取了一位歌手作为代表分析了一下词频,如下所示:
做了一个词云:
然后。把所有的歌词都分析了一下,得到了如下饼状图:
还做了一个词云,如下所示:
接下来的工作
情绪分析
云音乐的评论很精彩,可以做一下评论,看看有什么发现
如何使用
git clone https://github.com/GreatV/CloudMusic-Crawler.git
cd CloudMusic-Crawler
python3 -m venv venv
source venv/bin/activate
pip install -r requirements.txt
cd NEMCrawler
python NEM_spider.py
python text_mining.py
firefox render.html
python网络爬虫网易云音乐guihub_GitHub - GreatV/CloudMusic-Crawler: 网易云音乐爬虫,数据可视化。...相关推荐
- Python入门到实战(五)自动化办公、pandas操作Excel、数据可视化、绘制柱状图、操作Word、数据报表生成、pip install国内镜像下载
Python入门到实战(五)conda使用.pandas操作Excel.数据可视化.绘制柱状图.操作Word.数据报表生成.pip install国内镜像下载 conda使用 常用操作 配置VS+Co ...
- Python数据分析初探项目 基于Python数据可视化的网易云音乐歌单分析系统 大学编程作业(TUST 天津科技大学 2022年)
Python 数据分析初探项目 基于 Python 数据可视化的网易云音乐歌单分析系统 大学编程作业(TUST 天津科技大学 2022 年) Python 数据分析初探项目 基于 Python 数据可 ...
- python网络数据爬取及分析_《Python网络数据采集》读后总结--第3章开始爬取数据及天善用户关系分析实例...
这次介绍一下<Python网络数据采集>这本书的第3章内容(Chpt03.开始爬数据的内容), 使用了天善用户关系分析的示例来介绍一下具体实践. 1.第3章内容简介 1-getWikiLi ...
- 【Python实现数据可视化】创建3D柱状图
虽然matplotlib主要专注于绘图,并且主要是二维的图形,但是它也有一些不同的扩展,能让我们在地理图上绘图,让我们把Excel和3D图表结合起来.在matplotlib的世界里,这些扩展叫做工具包 ...
- python内容推荐理由_好书推荐~第5期 | Python 数据可视化
今天为大家推荐python 数据可视化学习相关的书籍.本书单是笔者经过个人阅读或多个网站书籍对比(当当/亚马逊/豆瓣等)后推荐的书籍. 1.<Python数据可视化之matplotlib实践&g ...
- Python商业数据可视化实战
序 言 目前,互联网全球化.移动设备普及化.物质世界网络化等,都在为"数据大爆发"储蓄能量,大数据已成为继云计算.物联网之后信息产业又一次颠覆性的技术变革.大数据时代正在变革着我们 ...
- python网络爬虫网易云音乐_一篇文章带你用Python网络爬虫实现网易云音乐歌词抓取...
标签下,如下图所示: 接下来我们利用美丽的汤来获取目标信息,直接上代码,如下图: 此处要注意获取ID的时候需要对link进行切片处理,得到的数字便是歌曲的ID:另外,歌曲名是通过get_text()方 ...
- Python网络爬虫实践(1):爬取网易云音乐播放量大于1000万的歌单
Python网络爬虫实践(1) 一.需求分析 爬取网易云音乐播放量大于1000万的歌单. 二.实施步骤 1.安装selenium selenium是一个用于Web应用自动化程序测试的工具,测试直接运行 ...
- python网络爬虫网易云音乐下载_python网络爬虫爬取网易云音乐
#爬取网易云音乐 url="https://music.163.com/discover/toplist" #歌单连接地址 url2 = 'http://music.163.com ...
- 手把手教你用Python网络爬虫获取网易云音乐歌曲
前天给大家分享了用Python网络爬虫爬取了网易云歌词,在文尾说要爬取网易云歌曲,今天小编带大家一起来利用Python爬取网易云音乐,分分钟将网站上的音乐down到本地. 跟着小编运行过代码的筒子们将 ...
最新文章
- 文计笔记2: 计算机硬件知识
- C语言面向对象编程(四):面向接口编程
- 一文详解神经网络与激活函数的基本原理
- 转转集团Q4手机行情:二手市场iPhone交易量今年以来首次“反弹”
- Linux服务器中解压zip包
- 第11月第18天 RACSequence
- 关于data.table中i, j, by都为数字的理解
- 愚人节的礼物 栈
- 【元胞自动机】基于matlab元胞自动机短消息网络病毒传播仿真【含Matlab源码 1289期】
- Microsoft Visual Studio .NET 2003 编译xvidcore-1.1.3
- Scrapy+MongoDB+FastAPI搭建免费IP代理池接口
- django tests 小结
- freeswitch呼叫中心之freeswitch集成百度MRCP智能语音
- 微信小程序 iOS tableview
- 校企联合学院分析ERP在家具行业中的应用
- Spring Mvc时间格式参数,前后时间传参,单个字段的时间格式化问题
- sfc/scannow检查并修复window系统
- 17.AtomicInteger、AtomicBoolean的底层原理
- CentOS8 NFS配置部署
- npm包管理工具与ES6官方模块化规范
热门文章
- 搜c语言题答案软件下载,C语言二级题库软件下载-C语言二级题库官方版下载v1.01-乐游网安卓下载...
- 织梦DEDE采集文章标题过短,自带采集标题限制,解决文章标题字数长度方法
- Phase2 Day14 Collections RedBlackTree
- POJ 3660 Cow Contest(Floyd求传递闭包(可达矩阵))
- 深度学习相关软件安装整理
- 三星 android驱动安装失败,三星安卓手机usb驱动安装教程
- 小米8对一加6打开软件速度测试,小米 8 对决一加 6,谁更值得买?
- Junit 单元测试 mybatis
- (亲测有效).net framework 在计算机上已安装了更高的 4.x 版本,则无法安装以前的 4.5 版本。
- 【bootcamp问答系统部署】