python爬虫之爱思助手音乐爬取
#1.爬虫库补充
# 安装靓汤 pip install beautifulsoup4
# 安装html5lib:html网页解析库pip install html5lib#
# 拓展:安装lxml pip install lxml
import os
import requests
from bs4 import BeautifulSoup
#1.请求url
url="https://www.i4.cn/ring_21_0_1.html"
#2.本地存储路径
def download():download="music/"#1.3 判断文件夹是否存在,如果存在直接使用,如果不存在创建if(not os.path.exists(download)):#创建目录os.mkdir(download)#4.使用requests发起请求response=requests.get(url)if(response.status_code==200):#print(response.text)#6、使用beautifulsoup4和html5lib解析网页内容# 友情提醒 安装bs4和html5libbs = BeautifulSoup(response.content,"html5lib")#print(bs,type(bs))#7. 查找存放所有音频的标签,div,class="kbox"#find:根据标签名和选择器进行查询,只会返回一个满足条件的标签#kbox=bs.find("div",attrs={"class":"kbox"})#print(kbox)#8、在kbox里面找所有的div标签(存放音频的div),div,class=“list ring_list"# find_all根据签名和选择器进行查询,返回所有满足条件的标签ringList = bs.find_all("div",attrs={"class":"ring_list"})#print(ringList,len(ringList),type(ringList))for ring in ringList:#10、使用ring查找存放音频的标签(div,class="btn audio_play")audioPlay=ring.find("div",attrs={"class":"audio_play"})#print(audioPlay)#11、获取audioPlay标签的data-mp3属性,获取音频的路径mp3Url=audioPlay.get("data-mp3")#print(mp3Url)# 12、获取个去名字title = ring.find("div",attrs={"class":"title"}).textwith open(download+title+".mp3","wb") as file:file.write(requests.get(mp3Url).content)print(title+"下载完成")
if __name__ == '__main__':download()
python爬虫之爱思助手音乐爬取相关推荐
- Python爬虫实战:网易云音乐爬取!
本次目标 爬取网易云音乐 https://music.163.com/ PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 python免费学习资料以及群交流解答点击即可加入 环境 ...
- python爬虫多久能学会-不踩坑的Python爬虫:如何在一个月内学会爬取大规模数据...
原标题:不踩坑的Python爬虫:如何在一个月内学会爬取大规模数据 Python爬虫为什么受欢迎 如果你仔细观察,就不难发现,懂爬虫.学习爬虫的人越来越多,一方面,互联网可以获取的数据越来越多,另一方 ...
- python爬虫入门实战---------一周天气预报爬取_Python爬虫入门实战--------一周天气预报爬取【转载】【没有分析...
Python爬虫入门实战--------一周天气预报爬取[转载][没有分析 Python爬虫入门实战--------一周天气预报爬取[转载][没有分析] 来源:https://blog.csdn.ne ...
- Python爬虫《自动化学报》数据爬取与数据分析
Python爬虫<自动化学报>数据爬取与数据分析 文章目录 Python爬虫<自动化学报>数据爬取与数据分析 前言 一.代码 二.结果展示 三.爬虫实现 1.准备 2.获取网页 ...
- 基于python爬虫————静态页面和动态页面爬取
基于python爬虫----静态页面和动态页面爬取 文章目录 基于python爬虫----静态页面和动态页面爬取 1. 爬虫的原理 2. 用正则表达式匹配获取数据 3. 页面源码解析 4. 通过req ...
- Python 爬虫 之 Selenium 模拟打开操作浏览器爬取斗鱼全部视播相关信息,并json保存信息
Python 爬虫 之 Selenium 模拟打开操作浏览器爬取斗鱼全部视播相关信息,并json保存信息 基础: Python 爬虫 之 Selenium.webdriver 的安装,以及模拟打开操作 ...
- Python爬虫小白教程(二)—— 爬取豆瓣评分TOP250电影
文章目录 前言 安装bs4库 网站分析 获取页面 爬取页面 页面分析 其他页面 爬虫系列 前言 经过上篇博客Python爬虫小白教程(一)-- 静态网页抓取后我们已经知道如何抓取一个静态的页面了,现在 ...
- Python爬虫学习基础——5分钟学会爬取B站视频日播放量排行
Python爬虫学习基础--5分钟学会爬取B站视频日播放量排行 基础包含 requests pyquery 进入正题 基础包含 这也是我当初第一次学习爬虫时做的练习,感觉给初学者练笔挺不错的.运用的知 ...
- Python爬虫系列(二):爬取中国大学排名丁香园-用户名和回复内容淘宝品比价
Python爬虫系列(二):爬取中国大学排名&丁香园-用户名和回复内容&淘宝品比价 目录 Python爬虫系列(二):爬取中国大学排名&丁香园-用户名和回复内容&淘宝品 ...
最新文章
- 如何用PyTorch进行语义分割?
- 在应用程序中加入.net脚本
- rtmp 推送h264 + aac 的数据
- tushare pro接口_利用tushare获取新闻联播文字稿并制作词云
- Ubuntu 18.x 环境下mysql创建用户并更改用户权限
- Android 通过高德地图获取地址的经纬度
- java小编程----四数之和
- .NET静态类的概念
- struts2的java.lang.NoSuchMethodException异常处理
- python高阶函数教学_Python 简明教程 --- 16,Python 高阶函数
- (68)信号发生器DDS协议(第14天)
- 解读30个提高Web程序执行效率的好经验
- Elasticsearch 安装的时候,Unsupported major.minor version 51.0问题的解决
- 第01期:salesforce开发环境的搭建
- 剑指offer(28)—数组中出现次数超过一半的数字
- 使用idea导出数据库脚本
- 卸载creative cloud
- android 打开公众号页面_解决「微信公众号」开发网页安卓端访问空白问题
- 启动马达接线实物图_三相电机直接启动接线图及启动过程解说
- uni-app 调用讯飞语音。
热门文章
- 聚力优创:拼多多的店铺怎么引流?秘诀分享
- 135编辑器html点击图片播放音乐,怎么用135编辑器排版 公众号怎么做点击切换图片...
- Failed to convert value of type 'java.lang.String' to required type 'java.util.Date
- linux 显卡 压力测试软件,显卡压力测试工具 GpuTest
- 笔记本电脑通过手机蓝牙上网
- 程序设计学习(c++)(课堂学习2)
- Oracle 考试题 原题
- mysql 1677_mysql之数据库主从复制配置报错1677
- VM虚拟机安装CentOS7系统后连接不上网络的问题(service netword restart)重启网卡和重置网络编译器
- fiddler编程猫死活hook不到的解决办法之一