三方包引入

使用到了以下包:

  • 爬虫 scrapy
  • 网络测试 requests
  • 数据分析 numpy和pandas
  • 绘图 matplotlib和wordcloud
pip install scrapypip install requestspip install numpypip install pandaspip install matplotlibpip install wordcloud

爬取数据

打开QQ音乐网页版的分类歌单界面,乍一看,一分析网页源码,看到下图:

那么看来它就是使用动态填充的,那么它肯定就调用了接口,请求数据,那么就去找,在检查里的network中找啊找,最终找到了它:

然后写上代码,经过调试,终于成功了。

最后我把它保存成一个csv文件,通过播放量排序,截取前20,得到了下图

分析数据

对于这个数据的处理,就用到了numpy和pandas以及matplotlib。经过分析得出下图结果:

播放次数分析

标签分析

github地址:

https://github.com/arvinljw/SpiderNet/blob/master/qqmusic/qqmusic/spiders/qqmusic.py

转载于:https://www.cnblogs.com/dawning666/articles/9433946.html

Python对QQ音乐进行爬取并进行数据分析相关推荐

  1. 基于python的音乐数据分析_Python对QQ音乐进行爬取并进行数据分析

    三方包引入 使用到了以下包: 爬虫 scrapy 网络测试 requests 数据分析 numpy和pandas 绘图 matplotlib和wordcloud pip install scrapy ...

  2. python播放在线音乐_Python爬取网易云音乐播放地址

    本帖最后由 bbbbbd 于 2017-9-25 12:13 编辑 Python爬取网易云音乐播放地址 运行环境:Python2.7 一.分析目标网站 首先打开网易云音乐的官网,在搜索列表中随便搜索一 ...

  3. 爬虫第5课-从QQ音乐上爬取周杰伦前5页歌词

    第一步:分析问题,明确目标 需求就是把关卡内的代码稍作修改,将周杰伦前五页歌曲的歌词都爬取下来,结果就是全部展示打印出来. 第二步:写代码 Network - XHR-client_search - ...

  4. python 网易云音乐评论爬取3

    参考链接: 解析网易云音乐的加密方式 https://www.jianshu.com/p/069e88181488 找到参数的加密方法 首先我们先看评论的加载方式,打开一首音乐的主页,然后打开开发工具 ...

  5. python爬取网易云音乐_Python 从零开始爬虫(七)——实战:网易云音乐评论爬取(附加密算法)...

    前言 某宝评论区已经成功爬取了,jd的也是差不多的方法,说实话也没什么好玩的,我是看上它们分析简单,又没加密才拿来试手的.如果真的要看些有趣的评论的话,我会选择网易云音乐,里面汇聚了哲学家,小说家,s ...

  6. 利用Python网络爬虫实现对网易云音乐歌词爬取

    今天小编给大家分享网易云音乐歌词爬取方法. 本文的总体思路如下: 找到正确的URL,获取源码: 利用bs4解析源码,获取歌曲名和歌曲ID: 调用网易云歌曲API,获取歌词: 将歌词写入文件,并存入本地 ...

  7. 酷狗音乐的爬取,基于python,从无到有完整教程-上:搭建环境及爬取原理讲解

    酷狗音乐的爬取,基于python,从无到有完整教程,使用微软新edge作为虚拟浏览器 搭建环境及爬取原理讲解 ⬇⬇⬇ 编码环境及工具准备: 编码工具:PyCharm 所需的库: import requ ...

  8. 酷狗音乐的爬取,基于python,从无到有完整教程-下:功能代码讲解

    酷狗音乐的爬取,从无到有完整教程-下:功能代码讲解 是的我又回来了,这次是代码的讲解哦. 参数项生成 上一章我们提到,在包含了歌曲url,歌曲信息的请求中,有几个参数项的值是随机数就可以,但是,你仔细 ...

  9. 送书|Python采集QQ音乐热歌榜首数据

    今天给大家带来用python采集QQ音乐的热评-文末有送书哦- 我们可以看到这首歌曲的评论有10881条,不愧是榜首热歌,评论比较高. 一.初步测试 我们首先使用selenium测试一下环境: fro ...

最新文章

  1. 计算机键盘上的哪个键可以复制,复制电脑键盘按什么
  2. Java串口包Javax.comm的安装
  3. css overflow属性的测试
  4. bash ./php-memcache.sh,PHP+shell脚本操作Memcached和Apache Status的实例分享
  5. httpd linux启动脚本,Linux下一个智能重启Apache服务器的脚本分享
  6. OFD文件预览—前后端两种实现方式
  7. 在计算机上采用线性同余法,随机数生成算法 —— 线性同余法
  8. ITIL是什么意思?ITIL是什么?
  9. 手动决战3721和雅虎助手
  10. 银联支付接口申请流程
  11. centos安装nginx配置webpy
  12. Android面试你必须要知道的那些知识,已拿offer附真题解析
  13. 直连附加存储服务器,直接连接存储
  14. 画江湖之独门暗器指针
  15. 模电1.1 半导体基础知识
  16. jquery 下拉列表框 改变 动态 改变相应值
  17. win10可以上网但是网路连接显示小地球(无法连接到Internet)
  18. Roadstar.ai陷罗生门!内斗升级,周光与另两位创始人各执一词...
  19. Kettle学习之记录集连接
  20. android sdk 需要下载安装哪些

热门文章

  1. ubuntu查看版本及检查是否有系统更新的命令
  2. helm部署postgresql
  3. linux deepin 升级内核命令
  4. golang变量使用细节
  5. go程序执行流程分析
  6. 请讲一下浏览器从接收到一个URL,到最后展示出页面,经历了哪些过程
  7. MySQL FIND_IN_SET(s1,s2) 返回在字符串s2中与s1匹配的字符串的位置
  8. Idea批量修改变量名
  9. sublime text常用快捷键及多行光标批量操作教程
  10. linux hashmap,Java中对HashMap的深度分析与比较