python爬虫之爱思助手音乐爬取

#1.爬虫库补充
#   安装靓汤 pip install beautifulsoup4
#   安装html5lib:html网页解析库pip install html5lib#
#   拓展：安装lxml  pip install lxml
import os
import requests
from bs4 import BeautifulSoup
#1.请求url
url="https://www.i4.cn/ring_21_0_1.html"
#2.本地存储路径
def download():download="music/"#1.3 判断文件夹是否存在，如果存在直接使用，如果不存在创建if(not os.path.exists(download)):#创建目录os.mkdir(download)#4.使用requests发起请求response=requests.get(url)if(response.status_code==200):#print(response.text)#6、使用beautifulsoup4和html5lib解析网页内容# 友情提醒 安装bs4和html5libbs = BeautifulSoup(response.content,"html5lib")#print(bs,type(bs))#7. 查找存放所有音频的标签，div,class="kbox"#find:根据标签名和选择器进行查询，只会返回一个满足条件的标签#kbox=bs.find("div",attrs={"class":"kbox"})#print(kbox)#8、在kbox里面找所有的div标签（存放音频的div），div，class=“list ring_list"# find_all根据签名和选择器进行查询，返回所有满足条件的标签ringList = bs.find_all("div",attrs={"class":"ring_list"})#print(ringList,len(ringList),type(ringList))for ring in ringList:#10、使用ring查找存放音频的标签（div,class="btn audio_play"）audioPlay=ring.find("div",attrs={"class":"audio_play"})#print(audioPlay)#11、获取audioPlay标签的data-mp3属性,获取音频的路径mp3Url=audioPlay.get("data-mp3")#print(mp3Url)# 12、获取个去名字title = ring.find("div",attrs={"class":"title"}).textwith open(download+title+".mp3","wb") as file:file.write(requests.get(mp3Url).content)print(title+"下载完成")
if __name__ == '__main__':download()

python爬虫之爱思助手音乐爬取相关推荐

Python爬虫实战：网易云音乐爬取！
本次目标爬取网易云音乐 https://music.163.com/ PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资料以及群交流解答点击即可加入环境 ...
python爬虫多久能学会-不踩坑的Python爬虫：如何在一个月内学会爬取大规模数据...
原标题:不踩坑的Python爬虫:如何在一个月内学会爬取大规模数据 Python爬虫为什么受欢迎如果你仔细观察,就不难发现,懂爬虫.学习爬虫的人越来越多,一方面,互联网可以获取的数据越来越多,另一方 ...
python爬虫入门实战---------一周天气预报爬取_Python爬虫入门实战--------一周天气预报爬取【转载】【没有分析...
Python爬虫入门实战--------一周天气预报爬取[转载][没有分析 Python爬虫入门实战--------一周天气预报爬取[转载][没有分析] 来源:https://blog.csdn.ne ...
Python爬虫《自动化学报》数据爬取与数据分析
Python爬虫<自动化学报>数据爬取与数据分析文章目录 Python爬虫<自动化学报>数据爬取与数据分析前言一.代码二.结果展示三.爬虫实现 1.准备 2.获取网页 ...
基于python爬虫————静态页面和动态页面爬取
基于python爬虫----静态页面和动态页面爬取文章目录基于python爬虫----静态页面和动态页面爬取 1. 爬虫的原理 2. 用正则表达式匹配获取数据 3. 页面源码解析 4. 通过req ...
Python 爬虫之 Selenium 模拟打开操作浏览器爬取斗鱼全部视播相关信息，并json保存信息
Python 爬虫之 Selenium 模拟打开操作浏览器爬取斗鱼全部视播相关信息,并json保存信息基础: Python 爬虫之 Selenium.webdriver 的安装,以及模拟打开操作 ...
Python爬虫小白教程（二）—— 爬取豆瓣评分TOP250电影
文章目录前言安装bs4库网站分析获取页面爬取页面页面分析其他页面爬虫系列前言经过上篇博客Python爬虫小白教程(一)-- 静态网页抓取后我们已经知道如何抓取一个静态的页面了,现在 ...
Python爬虫学习基础——5分钟学会爬取B站视频日播放量排行
Python爬虫学习基础--5分钟学会爬取B站视频日播放量排行基础包含 requests pyquery 进入正题基础包含这也是我当初第一次学习爬虫时做的练习,感觉给初学者练笔挺不错的.运用的知 ...
Python爬虫系列（二）：爬取中国大学排名丁香园-用户名和回复内容淘宝品比价
Python爬虫系列(二):爬取中国大学排名&丁香园-用户名和回复内容&淘宝品比价目录 Python爬虫系列(二):爬取中国大学排名&丁香园-用户名和回复内容&淘宝品 ...

python爬虫之爱思助手音乐爬取

python爬虫之爱思助手音乐爬取相关推荐

最新文章

热门文章