#1.爬虫库补充
#   安装靓汤 pip install beautifulsoup4
#   安装html5lib:html网页解析库pip install html5lib#
#   拓展:安装lxml  pip install lxml
import os
import requests
from bs4 import BeautifulSoup
#1.请求url
url="https://www.i4.cn/ring_21_0_1.html"
#2.本地存储路径
def download():download="music/"#1.3 判断文件夹是否存在,如果存在直接使用,如果不存在创建if(not os.path.exists(download)):#创建目录os.mkdir(download)#4.使用requests发起请求response=requests.get(url)if(response.status_code==200):#print(response.text)#6、使用beautifulsoup4和html5lib解析网页内容# 友情提醒 安装bs4和html5libbs = BeautifulSoup(response.content,"html5lib")#print(bs,type(bs))#7. 查找存放所有音频的标签,div,class="kbox"#find:根据标签名和选择器进行查询,只会返回一个满足条件的标签#kbox=bs.find("div",attrs={"class":"kbox"})#print(kbox)#8、在kbox里面找所有的div标签(存放音频的div),div,class=“list ring_list"# find_all根据签名和选择器进行查询,返回所有满足条件的标签ringList = bs.find_all("div",attrs={"class":"ring_list"})#print(ringList,len(ringList),type(ringList))for ring in ringList:#10、使用ring查找存放音频的标签(div,class="btn audio_play")audioPlay=ring.find("div",attrs={"class":"audio_play"})#print(audioPlay)#11、获取audioPlay标签的data-mp3属性,获取音频的路径mp3Url=audioPlay.get("data-mp3")#print(mp3Url)# 12、获取个去名字title = ring.find("div",attrs={"class":"title"}).textwith open(download+title+".mp3","wb") as file:file.write(requests.get(mp3Url).content)print(title+"下载完成")
if __name__ == '__main__':download()

python爬虫之爱思助手音乐爬取相关推荐

  1. Python爬虫实战:网易云音乐爬取!

    本次目标 爬取网易云音乐 https://music.163.com/ PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资料以及群交流解答点击即可加入 环境 ...

  2. python爬虫多久能学会-不踩坑的Python爬虫:如何在一个月内学会爬取大规模数据...

    原标题:不踩坑的Python爬虫:如何在一个月内学会爬取大规模数据 Python爬虫为什么受欢迎 如果你仔细观察,就不难发现,懂爬虫.学习爬虫的人越来越多,一方面,互联网可以获取的数据越来越多,另一方 ...

  3. python爬虫入门实战---------一周天气预报爬取_Python爬虫入门实战--------一周天气预报爬取【转载】【没有分析...

    Python爬虫入门实战--------一周天气预报爬取[转载][没有分析 Python爬虫入门实战--------一周天气预报爬取[转载][没有分析] 来源:https://blog.csdn.ne ...

  4. Python爬虫《自动化学报》数据爬取与数据分析

    Python爬虫<自动化学报>数据爬取与数据分析 文章目录 Python爬虫<自动化学报>数据爬取与数据分析 前言 一.代码 二.结果展示 三.爬虫实现 1.准备 2.获取网页 ...

  5. 基于python爬虫————静态页面和动态页面爬取

    基于python爬虫----静态页面和动态页面爬取 文章目录 基于python爬虫----静态页面和动态页面爬取 1. 爬虫的原理 2. 用正则表达式匹配获取数据 3. 页面源码解析 4. 通过req ...

  6. Python 爬虫 之 Selenium 模拟打开操作浏览器爬取斗鱼全部视播相关信息,并json保存信息

    Python 爬虫 之 Selenium 模拟打开操作浏览器爬取斗鱼全部视播相关信息,并json保存信息 基础: Python 爬虫 之 Selenium.webdriver 的安装,以及模拟打开操作 ...

  7. Python爬虫小白教程(二)—— 爬取豆瓣评分TOP250电影

    文章目录 前言 安装bs4库 网站分析 获取页面 爬取页面 页面分析 其他页面 爬虫系列 前言 经过上篇博客Python爬虫小白教程(一)-- 静态网页抓取后我们已经知道如何抓取一个静态的页面了,现在 ...

  8. Python爬虫学习基础——5分钟学会爬取B站视频日播放量排行

    Python爬虫学习基础--5分钟学会爬取B站视频日播放量排行 基础包含 requests pyquery 进入正题 基础包含 这也是我当初第一次学习爬虫时做的练习,感觉给初学者练笔挺不错的.运用的知 ...

  9. Python爬虫系列(二):爬取中国大学排名丁香园-用户名和回复内容淘宝品比价

    Python爬虫系列(二):爬取中国大学排名&丁香园-用户名和回复内容&淘宝品比价 目录 Python爬虫系列(二):爬取中国大学排名&丁香园-用户名和回复内容&淘宝品 ...

最新文章

  1. 如何用PyTorch进行语义分割?
  2. 在应用程序中加入.net脚本
  3. rtmp 推送h264 + aac 的数据
  4. tushare pro接口_利用tushare获取新闻联播文字稿并制作词云
  5. Ubuntu 18.x 环境下mysql创建用户并更改用户权限
  6. Android 通过高德地图获取地址的经纬度
  7. java小编程----四数之和
  8. .NET静态类的概念
  9. struts2的java.lang.NoSuchMethodException异常处理
  10. python高阶函数教学_Python 简明教程 --- 16,Python 高阶函数
  11. (68)信号发生器DDS协议(第14天)
  12. 解读30个提高Web程序执行效率的好经验
  13. Elasticsearch 安装的时候,Unsupported major.minor version 51.0问题的解决
  14. 第01期:salesforce开发环境的搭建
  15. 剑指offer(28)—数组中出现次数超过一半的数字
  16. 使用idea导出数据库脚本
  17. 卸载creative cloud
  18. android 打开公众号页面_解决「微信公众号」开发网页安卓端访问空白问题
  19. 启动马达接线实物图_三相电机直接启动接线图及启动过程解说
  20. uni-app 调用讯飞语音。

热门文章

  1. 聚力优创:拼多多的店铺怎么引流?秘诀分享
  2. 135编辑器html点击图片播放音乐,怎么用135编辑器排版 公众号怎么做点击切换图片...
  3. Failed to convert value of type 'java.lang.String' to required type 'java.util.Date
  4. linux 显卡 压力测试软件,显卡压力测试工具 GpuTest
  5. 笔记本电脑通过手机蓝牙上网
  6. 程序设计学习(c++)(课堂学习2)
  7. Oracle 考试题 原题
  8. mysql 1677_mysql之数据库主从复制配置报错1677
  9. VM虚拟机安装CentOS7系统后连接不上网络的问题(service netword restart)重启网卡和重置网络编译器
  10. fiddler编程猫死活hook不到的解决办法之一