本篇文章适用于Python小白的教程篇,如果有哪里不足欢迎指出来,希望对你帮助。

本篇文章用到的模块:

requests,re,os,jieba,glob,json,lxml,pyecharts,heapq,collection

首先

我们先进入到需要抓取的内容的地址:http://music.163.com/#

本文我们的目的

  • 抓取周杰伦的所有歌曲,
  • 歌词,
  • 以及评论

直接在搜索框搜索周杰伦

第一步:

抓取所有专辑 进入http://music.163.com/#/artist/album?id=6452如下图所示!

在谷歌浏览器的抓包工具(F12)里面查看交互信息发现如下:

如图所示:是我们需要的信息,知道这些事情就变得简单了

我们不需要用复杂的工具比如(selenium)去加载整个页面

事实上,如果还没想到抓取歌曲的方法,我估计就得用它了

我们再看header里面有什么

更多Python相关视频、资料加群857662006免费获取

这里面的string就不用管了,因为它已经在我们的url里面了

只需要看request headers 这个就是我们给服务器发送的东西,

发送之后,服务器返回给我们的就是network里面的信息。

好,接下来我们伪造浏览器发送请求。

具体代码如下:

这里面用到了xpath来找到对应标签里面数据,

代码不重要,思想懂了就行(代码单独执行可行)

执行结果如下:

开始抓取歌曲信息

同样的道理我们通过伪造方式发送信息,获取歌曲信息!!

直接上代码

上面需要注意:xpath来获取需要的信息,利用正则来获取ID(其实有很多方法)

一样的道理,我们分析network来获取我们需要的信息歌词,评论!!

直接上代码

上面需要注意的是:利用json获取需要的数据(至少比正则快点)

数据分析,可视化

上面需要注意的是:我们合并数据的时候,可以选择性的删除一些无用数据

下面我们对周杰伦歌曲进行情绪化分析

下面完成数据词频各种分析

我们来看下结果

怎么样,学到了吗?看完记得动手操作哦!

适用于Python入门者的爬虫和数据可视化案例相关推荐

  1. python爬虫数据可视化_适用于Python入门者的爬虫和数据可视化案例

    本篇文章适用于Python小白的教程篇,如果有哪里不足欢迎指出来,希望对你帮助. 本篇文章用到的模块: requests,re,os,jieba,glob,json,lxml,pyecharts,he ...

  2. 【计算机专业毕设之基于python猫咪网爬虫大数据可视化分析系统-哔哩哔哩】 https://b23.tv/jRN6MVh

    [计算机专业毕设之基于python猫咪网爬虫大数据可视化分析系统-哔哩哔哩] https://b23.tv/jRN6MVh https://b23.tv/jRN6MVh

  3. Python实验1——网络爬虫及数据可视化

    Python实验1--网络爬虫及数据可视化 一.实验目标与基本要求 实验目标 基本要求 二.主要知识点.重点与难点 主要知识点 重点 难点 三.实验过程设计 获取网页 获取数据 保存到数据库 数据预处 ...

  4. python科学坐标系绘制分析_python数据可视化案例——平行坐标系(使用pyecharts或pandas)...

    平行坐标是可视化高维几何和分析多元数据的常用方法. 为了在n维空间中显示一组点,绘制由n条平行线组成的背景,通常是垂直且等距的.所述的点N 维空间被表示为折线与顶点在平行的轴线: 第i 轴上顶点的位置 ...

  5. Python爬虫以及数据可视化分析!这才是零基础入门案例!

    简单几步,通过Python对B站番剧排行数据进行爬取,并进行可视化分析 下面,我们开始吧! PS: 作为Python爬虫初学者,如有不正确的地方,望各路大神不吝赐教[抱拳] 本项目将会对B站番剧排行的 ...

  6. python 爬虫与数据可视化

    python 爬虫与数据可视化 1.引言 Web已经成为日新月异迅速发展的网络信息技术中的信息载体,如何有效地提取和利用搜索引擎获得互联网最有用的.可以免费公开访问的数据集,查找用户所需的价值数据或者 ...

  7. python爬虫数据可视化_python 爬虫与数据可视化--python基础知识

    摘要:偶然机会接触到python语音,感觉语法简单.功能强大,刚好朋友分享了一个网课<python 爬虫与数据可视化>,于是在工作与闲暇时间学习起来,并做如下课程笔记整理,整体大概分为4个 ...

  8. Python爬虫以及数据可视化分析!

    简单几步,通过Python对B站番剧排行数据进行爬取,并进行可视化分析 源码文件可以参考Github上传的项目:https://github.com/Lemon-Sheep/Py/tree/maste ...

  9. python爬虫可视化excel_Python爬虫以及数据可视化分析!

    简单几步,通过Python对B站番剧排行数据进行爬取,并进行可视化分析 下面,我们开始吧! PS: 作为Python爬虫初学者,如有不正确的地方,望各路大神不吝赐教[抱拳] 本项目将会对B站番剧排行的 ...

  10. python 爬虫及数据可视化展示

    python 爬虫及数据可视化展示 学了有关python爬虫及数据可视化的知识,想着做一些总结,加强自己的学习成果,也能给各位小伙伴一些小小的启发. 1.做任何事情都要明确自己的目的,想要做什么,打算 ...

最新文章

  1. 深度学习开源库tiny-dnn的使用(MNIST)
  2. TCGAbiolinks包下载TCGA数据
  3. (七十九)MapKit的基本使用
  4. PostgreSQL学习笔记3之表的继承和分区
  5. mysql保存时乱码了_MySQL保存中文乱码的原因和解决办法
  6. sql 如何设置行级锁_SQL Server中的行级安全性简介
  7. 计算机视觉论文-2021-07-27
  8. 毛星云opencv之DrawLine函数写法
  9. 一千万人都在等小黄车OFO退押金
  10. vue在vscode代码格式化
  11. tws耳机哪个牌子音质好?tws耳机音质排行榜
  12. 高通AKM8975地磁传感器分析
  13. Python中的range函数和arange函数的区别与联系
  14. MySql-基础查询与排序
  15. 使用numpy.sin()打印矢量/矩阵元素的正弦值 使用Python的线性代数
  16. ClassNotFoundException: org.codehaus.plexus.compiler.manager.NoSuchCompilerException
  17. Android自定义View教你一步一步实现即刻点赞效果
  18. 特征脸算法c语言,本科毕业论文—人脸识别.doc
  19. 高通骁龙888有哪些手机 高通骁龙888有什么手机
  20. Camera2 OpenCamera流程

热门文章

  1. LOL开发者谈网游自动化测试:每天10万次
  2. Python中print的用法
  3. python的print输出格式举例_python中print输出格式是什么
  4. oom killer java_Linux应用进程消失之谜--Java进程与OOM Killer
  5. How-To Geek正在寻找远程全职技术作家
  6. arduino as5048工作原理_普通精度应用的另一种选择——磁性旋转编码器
  7. 力扣LeetCode刷题笔记总结1
  8. 网站优化排名的5个方法
  9. 怎么给ChemDraw反应式添加分数系数
  10. 计算机二级第二课堂学记录表,高职学院关于第二课堂学分实施的通知(2020版)...