python爬取音乐下载_Python爬取全抖音好听背景音乐,一次性下载
5月和朋友聊天,决定开设一个公众号,以博客的方式每天记载Python知识和有趣的内容。之后经过前期准备与摸索终于在5月31号,首次在公众号尝试发文,而今已过两月时间。
刚开始每天下班就期待着开始自己所谓的创作,而现在每晚发愁该写些什么来满足大家的口味;起初媳妇儿大力支持我学习,如今因为写公众号没时间陪家人,时而会引发矛盾。细数两个月更新56篇的文章,用一位简书朋友的评论高产似母猪,哈哈….
由于做公众号的初衷,是整理学习内容,而非多数人那样的想将自媒体作为副业,所以没有找过大号求推荐,也没有主动向其他公众号推荐文章。起初让朋友帮忙发个朋友圈扩散下,之后就是每天清晨转发下自己的文章,偶尔将文章转载至公司内网博客。大家都说东西再好不宣传也没人知道,但两个月下来收获了800粉丝,还是让我很感动。不知道还能这样每周五篇的坚持更新多久,因为自从开了公众号,每天都是2、3点睡觉,两个月下来严重缺乏睡眠,而且经常熬夜最近胃病又犯了。但对比之前每天回来刷刷抖音、看小说、做做饭的日子充实多了。只希望能得到家人和朋友们更多的支持,谢谢大家。
不知道什么时候开始,中国出现了南抖音、北快手的互文格局(东市买骏马,西市买鞍鞯…)。刚才提到了,之前比较喜欢刷抖音,对于我这种佛系程序猿,看网上这些整容妹子基本一个样。喜欢抖音主要是两个初衷,学做菜听音乐。朋友之前常说,人家抖音看妹子看的乐呵呵,你看人家做菜也能津津有味,一个人在那儿傻笑…民以食为天,我看到色香味俱全的菜,做的那么好吃的乐呵乐呵还不行么。
抖音捧红了很多人,也让很多本不怎么让大家熟知的歌曲、BGM,经过翻唱、混剪与视频搭配,从而传播大街小巷。什么“若不是你,突然闯进我心里…”亦或者“也许未来遥远在光年之外,我愿守候未知里为你等待…”,成了大家闲时在嘴边哼唱的调调。那么,有没有想过将这些好听的剪辑批量下载下来呢?
python下载抖音内容的帖子网上有一些,但都比较麻烦,需要通过adb连接安卓手机后,模拟操作。我这么懒,这种事儿玩不来…那么,该如何获取抖音内容呢?网上搜了下大概有两种方式,一个是浏览器插件快抖,另外一个是我今天要说的抖音网页版。其实这两者差别不是很大,都是先将抖音内容下载至服务器后,通过开发简单网站配置域名后,让大家访问。让我们来看看抖音网页版:
哎哟吼,居然看到了昨天爬虫的“乔奶奶”…当然今天的重点不是视频,而是下载它全站所有的音乐!
热歌榜内容
大家先开看看这个抖音热歌榜歌曲,每页20首歌曲,一个55页。但细不细心大家都能发现,很多歌曲存在重复的问题。所以,等下爬虫的时候,我们需要先准备一个music_list,用来识别这首歌曲是否已经下载过了…网页解析
网页比较简单,一个div中包裹了一个ul>li*20,我们是不是该这样获取:soup.find('div',{"class":"pull-left"}).find('ul').findAll('a')
如果你说是,那么一定没有好好看我前天整理的文章通过哪吒豆瓣影评,带你分析python爬虫快速入门:https://www.jianshu.com/p/ae38f7607902,我在文章中专门提到了一个小技巧,通过使用attr的属性进行快速解析,那么最快速的获取方式是:
soup.findAll('a', attrs={'onclick': True})
我们只需要获取所有的a标签,切这些标签中包含onclick这个属性即可。巧用eval
我们解析到的内容通过attr[‘onclick’],可以得到他的属性open1(index = "open1('夜','http://p9-dy.byteimg.com/obj/61a20007a98954b0831d','')"
index[5:]
"('夜','http://p9-dy.byteimg.com/obj/61a20007a98954b0831d','')"
index_tuple = eval(index[5:])
print(index_tuple, type(index_tuple))
('夜', 'http://p9-dy.byteimg.com/obj/61a20007a98954b0831d', '')
index_tuple[0]
'夜'
index_tuple[1]
'http://p9-dy.byteimg.com/obj/61a20007a98954b0831d'
ps:今天一个朋友说我写代码没注释,我这是现身说法的告诉你,如何能写出让别人压根看不懂的代码,就是不写注释啊,哈哈!其实,代码我都在文章中一点一点的讲解了,所以没有写,但秉承着害怕大佬们取关的心态,我还是把注释加上吧…
总体来说实现比较简单,全部代码如下:# -*- coding: utf-8 -*-
# @Author : 王翔
# @JianShu : 清风Python
# @Date : 2019/7/31 23:25
# @Software : PyCharm
# @version :Python 3.7.3
# @File : DouYinMusic.py
import os
import requests
from bs4 import BeautifulSoup
import threading
import time
class DouYinMusic:
def __init__(self):
self.music_list = []
self.path = self.download_path()
@staticmethod
def download_path():
"""
获取代码执行目录,并在目录下创建Music文件夹
:return Music文件夹全路径
"""
base_dir = os.path.dirname(os.path.abspath(__file__))
_path = os.path.join(base_dir, "Music")
if not os.path.exists(_path):
os.mkdir(_path)
return _path
def get_request(self, url):
"""
封装requests.get方法
如果为网页请求,返回网页内容
否则,解析音乐地址,并返回音乐二进制文件
:param url: 请求url(分网页、音乐两类)
:return: 网页内容 & 音乐二进制文件
"""
r = requests.get(url, timeout=5)
if url.endswith('html'):
return r.text
else:
return r.content
def analysis_html(self, html):
"""
根据获取的网页内容,解析音乐名称、下载地址
调用音乐下载方法
:param html: 网页内容
"""
soup = BeautifulSoup(html, 'lxml')
# 根据关键字onclick查找每个下载地址
for tag_a in soup.findAll('a', attrs={'onclick': True}):
# 下载格式'("name","link","")',通过eval将str转化为tuple类型
link_list = eval(tag_a['onclick'][5:])
music_name, music_link = link_list[:2]
# 因为存在部分重复音乐,故设置判断下载过的音乐跳过
if music_name in self.music_list:
continue
self.music_list.append(music_name)
t = threading.Thread(target=self.download_music, args=(music_name, music_link))
time.sleep(0.5)
t.start()
def download_music(self, music_name, music_link):
"""
解析音乐文件,完成音乐下载
:param music_name: 音乐名称
:param music_link: 下载地址
"""
_full_name = os.path.join(self.path, music_name)
with open(_full_name + '.mp3', 'wb') as f:
f.write(self.get_request(music_link))
print("抖音音乐:{} 下载完成".format(music_name))
def run(self):
"""
主方法,用于批量生成url
"""
for page in range(1,55):
url = "http://douyin.bm8.com.cn/t_{}.html".format(page)
html = self.get_request(url)
self.analysis_html(html)
if __name__ == '__main__':
main = DouYinMusic()
main.run()
来让我们看看效果吧:
网站是通过nginx负载均衡搭建的,有一些链接已经失效了。最终下载了不重复的592首抖音音乐。
同样的,大家喜欢可以按照这种方法,尝试下载一下网站的抖音视频。
如果大家喜欢,【清风Python】公众号回复抖音音乐即可获取百度云下载链接。
如果觉得不错,希望能动动手指转发给你身边的朋友们。♥
---------------
本文转自作者:王翔|清风Python
python爬取音乐下载_Python爬取全抖音好听背景音乐,一次性下载相关推荐
- python爬取音乐排行_python爬取网易云音乐热歌榜实例代码
首先找到要下载的歌曲排行榜的链接,这里用的是: https://music.163.com/discover/toplist?id=3778678 然后更改你要保存的目录,目录要先建立好文件夹,例如我 ...
- python爬取音乐排行_Python爬取酷狗Top500的歌曲!够你吹个小牛皮了吧
一.准备工作 安装 requests 库和 beautifulsoup4 库: requests 库是处理HTTP请求的一个简洁且简单的第三方库:beautifulsoup4 库是一个解析和处理HTM ...
- Python网易云音乐单曲爬取
Python网易云音乐单曲爬取 代码: import requests import osdef develop(path,url):song_url = urlsong_id = song_url[ ...
- 抖音短视频数据抓取实战系列(十)——获取抖音dom元素属性
抖音短视频数据抓取实战系列(十)--获取抖音dom元素属性 项目目录 1.抖音短视频数据抓取实战系列(〇)--前言 2.抖音短视频数据抓取实战系列(一)--模拟器的选择与设置 3.抖音短视频数据抓取实 ...
- 刘德华开抖音了,一键下载华仔所有无水印视频
苏生不惑第229 篇原创文章,将本公众号设为星标,第一时间看最新文章. 不老男人刘德华最近开通抖音了,我也是在微博上看到才发现的,为了看他的抖音我再次下载了抖音APP(如果有网站就好了,上次也是为了写 ...
- 抖音qu水印采集下载源码 附带成品软件
介绍: 采集抖音qu水印视频下载,调用精易模块,里面鱼刺HTTP可以删除,需要的拿去. 为了方便大家使用 小编给大家编译好一个成品软件 网盘下载地址: http://kekewl.cc/y31RES6 ...
- 抖音视频无水印下载工具 绿色版
抖音视频无水印下载是一款用于抖音视频解析出来并下载的下载工具.可以轻松下载自己喜欢的视频,而且无水印,需要的快来下载使用吧! 抖音视频无水印下载 [工具特点] 支持解析任何抖音视频 解析出来的视频没有 ...
- 抖音推荐超快下载软件IDM
抖音推荐超快下载软件IDM 绿色版 领福利 版本号:v6.31 下载链接
- python爬取qq音乐周杰伦_Python爬取QQ音乐url及批量下载
QQ音乐还是有不少的好音乐,有些时候想要下载好听的音乐,如果在网页下载都是还需要登录什么的.于是,来了个QQmusic的爬虫.至少我觉得for循环爬虫,最核心的应该就是找到待爬元素所在url吧. 参考 ...
- python爬取qq音乐标签_Python爬取qq音乐的过程实例
一.前言 qq music上的音乐还是不少的,有些时候想要下载好听的音乐,但有每次在网页下载都是烦人的登录什么的.于是,来了个qqmusic的爬虫.至少我觉得for循环爬虫,最核心的应该就是找到待爬元 ...
最新文章
- android java 时间测试方法_一个让你开挂的Android 性能测试方法
- 随堂小测app(nabcd)
- 系统向腾讯通RTX发提醒消息,“应用SDK:连接SDK服务器错误”
- ClickHouse【资源分享 01】Linux环境 clickhouse-19.7.3.9 离线安装文件分享(百度云盘)
- python练习,随机数字 函数,循环,if,格式化输出
- 重构第12天 分解依赖(Break Dependencies)
- NHibernate从入门到精通系列(5)——持久对象的生命周期(下)
- python小工具自动审单录凭证_跟着老板工作了二十年,最近来了个新员工然后我被开除了...
- Java集合(二、LinkHashMap)
- 掌握 Microsoft Excel 宏和 Excel VBA
- 介绍一些新手都能看的明白的基础破解教程
- 智慧城管核心应用系统建设
- 滴滴技术专家任玉刚:让你的职业迷茫从哪来回哪去
- 在线客服代码:在线QQ客服、在线旺旺客服
- win10 cmd窗口切换目录并运行python代码
- V2X测试系列——V2X应用场景仿真及开发流程
- office 在线预览
- Visual Studio 2008项目打包问题——项目太大C盘空间不够怎么办?
- 兰道尔原理(Laudauer‘s Principle)
- Spring Boot+Vue项目学习总结