公众号两个月

5月和朋友聊天,决定开设一个公众号,以博客的方式每天记载Python知识和有趣的内容。之后经过前期准备与摸索终于在5月31号,首次在公众号尝试发文,而今已过两月时间。

刚开始每天下班就期待着开始自己所谓的创作,而现在每晚发愁该写些什么来满足大家的口味;起初媳妇儿大力支持我学习,如今因为写公众号没时间陪家人,时而会引发矛盾。细数两个月更新56篇的文章,用一位简书朋友的评论高产似母猪,哈哈…

由于做公众号的初衷,是整理学习内容,而非多数人那样的想将自媒体作为副业,所以没有找过大号求推荐,也没有主动向其他公众号推荐文章。起初让朋友帮忙发个朋友圈扩散下,之后就是每天清晨转发下自己的文章,偶尔将文章转载至公司内网博客。大家都说东西再好不宣传也没人知道,但两个月下来收获了800粉丝,还是让我很感动。不知道还能这样每周五篇的坚持更新多久,因为自从开了公众号,每天都是2、3点睡觉,两个月下来严重缺乏睡眠,而且经常熬夜最近胃病又犯了。但对比之前每天回来刷刷抖音、看小说、做做饭的日子充实多了。只希望能得到家人和朋友们更多的支持,谢谢大家。

刚才提到抖音?

不知道什么时候开始,中国出现了南抖音、北快手的互文格局(东市买骏马,西市买鞍鞯…)。刚才提到了,之前比较喜欢刷抖音,对于我这种佛系程序猿,看网上这些整容妹子基本一个样。喜欢抖音主要是两个初衷,学做菜听音乐。朋友之前常说,人家抖音看妹子看的乐呵呵,你看人家做菜也能津津有味,一个人在那儿傻笑…民以食为天,我看到色香味俱全的菜,做的那么好吃的乐呵乐呵还不行么。
抖音捧红了很多人,也让很多本不怎么让大家熟知的歌曲、BGM,经过翻唱、混剪与视频搭配,从而传播大街小巷。什么“若不是你,突然闯进我心里…”亦或者“也许未来遥远在光年之外,我愿守候未知里为你等待…”,成了大家闲时在嘴边哼唱的调调。那么,有没有想过将这些好听的剪辑批量下载下来呢?

python链接抖音

python下载抖音内容的帖子网上有一些,但都比较麻烦,需要通过adb连接安卓手机后,模拟操作。我这么懒,这种事儿玩不来…那么,该如何获取抖音内容呢?网上搜了下大概有两种方式,一个是浏览器插件快抖,另外一个是我今天要说的抖音网页版。其实这两者差别不是很大,都是先将抖音内容下载至服务器后,通过开发简单网站配置域名后,让大家访问。让我们来看看抖音网页版:

哎哟吼,居然看到了昨天爬虫的*“乔奶奶”*…当然今天的重点不是视频,而是下载它**全站所有的音乐!**当然看过了今天的文章,你使用同样的方式,简单改几行代码,就可以爬它全站的视频了…

爬虫实现分析
热歌榜内容

大家先开看看这个抖音热歌榜歌曲,每页20首歌曲,一个55页。但细不细心大家都能发现,很多歌曲存在重复的问题。所以,等下爬虫的时候,我们需要先准备一个music_list,用来识别这首歌曲是否已经下载过了…

网页解析

网页比较简单,一个div中包裹了一个ul>li*20,我们是不是该这样获取:

soup.find('div',{"class":"pull-left"}).find('ul').findAll('a')

如果你说是,那么一定没有好好看我前天整理的文章通过哪吒豆瓣影评,带你分析python爬虫快速入门:https://www.jianshu.com/p/ae38f7607902,我在文章中专门提到了一个小技巧,通过使用attr的属性进行快速解析,那么最快速的获取方式是:
soup.findAll('a', attrs={'onclick': True})
我们只需要获取所有的a标签,切这些标签中包含onclick这个属性即可。

巧用eval

我们解析到的内容通过attr[‘onclick’],可以得到他的属性open1(‘夜’,‘http://p9-dy.byteimg.com/obj/61a20007a98954b0831d’,’’),如何能快速获取歌曲名字和url呢?这里我们需要用到一个eval的小技巧:

index = "open1('夜','http://p9-dy.byteimg.com/obj/61a20007a98954b0831d','')"
index[5:]
"('夜','http://p9-dy.byteimg.com/obj/61a20007a98954b0831d','')"
index_tuple = eval(index[5:])
print(index_tuple, type(index_tuple))
('夜', 'http://p9-dy.byteimg.com/obj/61a20007a98954b0831d', '') <class 'tuple'>
index_tuple[0]
'夜'
index_tuple[1]
'http://p9-dy.byteimg.com/obj/61a20007a98954b0831d'

ps:今天一个朋友说我写代码没注释,我这是现身说法的告诉你,如何能写出让别人压根看不懂的代码,就是不写注释啊,哈哈!
其实,代码我都在文章中一点一点的讲解了,所以没有写,但秉承着害怕大佬们取关的心态,我还是把注释加上吧…

代码实现

总体来说实现比较简单,全部代码如下:

# -*- coding: utf-8 -*-
# @Author   : 王翔
# @JianShu  : 清风Python
# @Date     : 2019/7/31 23:25
# @Software : PyCharm
# @version  :Python 3.7.3
# @File     : DouYinMusic.pyimport os
import requests
from bs4 import BeautifulSoup
import threading
import timeclass DouYinMusic:def __init__(self):self.music_list = []self.path = self.download_path()@staticmethoddef download_path():"""获取代码执行目录,并在目录下创建Music文件夹:return Music文件夹全路径"""base_dir = os.path.dirname(os.path.abspath(__file__))_path = os.path.join(base_dir, "Music")if not os.path.exists(_path):os.mkdir(_path)return _pathdef get_request(self, url):"""封装requests.get方法如果为网页请求,返回网页内容否则,解析音乐地址,并返回音乐二进制文件:param url: 请求url(分网页、音乐两类):return: 网页内容 & 音乐二进制文件"""r = requests.get(url, timeout=5)if url.endswith('html'):return r.textelse:return r.contentdef analysis_html(self, html):"""根据获取的网页内容,解析音乐名称、下载地址调用音乐下载方法:param html: 网页内容"""soup = BeautifulSoup(html, 'lxml')# 根据关键字onclick查找每个下载地址for tag_a in soup.findAll('a', attrs={'onclick': True}):# 下载格式'("name","link","")',通过eval将str转化为tuple类型link_list = eval(tag_a['onclick'][5:])music_name, music_link = link_list[:2]# 因为存在部分重复音乐,故设置判断下载过的音乐跳过if music_name in self.music_list:continueself.music_list.append(music_name)t = threading.Thread(target=self.download_music, args=(music_name, music_link))time.sleep(0.5)t.start()def download_music(self, music_name, music_link):"""解析音乐文件,完成音乐下载:param music_name: 音乐名称:param music_link: 下载地址"""_full_name = os.path.join(self.path, music_name)with open(_full_name + '.mp3', 'wb') as f:f.write(self.get_request(music_link))print("抖音音乐: {} 下载完成".format(music_name))def run(self):"""主方法,用于批量生成url"""for page in range(1,55):url = "http://douyin.bm8.com.cn/t_{}.html".format(page)html = self.get_request(url)self.analysis_html(html)if __name__ == '__main__':main = DouYinMusic()main.run()

来让我们看看效果吧:

网站是通过nginx负载均衡搭建的,有一些链接已经失效了。最终下载了不重复的592首抖音音乐。

同样的,大家喜欢可以按照这种方法,尝试下载一下网站的抖音视频。

The End

OK,今天的内容就到这里,如果觉得内容对你有所帮助,欢迎点击文章右下角的“在看”。
代码与下载好的音乐,如果大家喜欢,公众号回复**抖音音乐即可获取百度云下载链接。
期待你关注我的公众号
清风Python**,如果觉得不错,希望能动动手指转发给你身边的朋友们。
希望每周一至五清晨的7点10分,都能让清风Python的知识文章叫醒大家!谢谢……

Python爬虫帮你打包下载所有抖音好听的背景音乐,还不快来一起听歌相关推荐

  1. Python帮你打包下载所有抖音背景音乐

    公众号两个月 5月和朋友聊天,决定开设一个公众号,以博客的方式每天记载Python知识和有趣的内容.之后经过前期准备与摸索终于在5月31号,首次在公众号尝试发文,而今已过两月时间. 公众号首次发文 刚 ...

  2. python爬虫———多线程threading模块爬取抖音用户信息

    爬虫背景: 由于原来的数据库中有1.5亿左右的用户id,但是其中有1.2亿的用户资料是不完整的(没有粉丝数量,点赞数量等,算是无用数据),现在老板要求将这些没有资料的用户更新信息,咋办? 刚开始的想法 ...

  3. 买不到口罩怎么办?Python 爬虫帮你时刻盯着自动下单!| 原力计划

    作者 | 菜园子哇 责编 | 唐小引 头图 | 下载自东方 IC 出品 | CSDN 博客 马上上班了,回来的路上,上班地铁上都是非常急需口罩的. 目前也非常难买到正品.发货快的口罩,许多药店都售完了 ...

  4. Python爬虫帮你抢秒杀

    什么是爬虫? 网络爬虫又被称为网页蜘蛛,网络机器人,是一种按照一定的规则,自动地抓取网络信息的程序或者脚本,另外一些不常使用的名字还有蚂蚁.自动索引.模拟程序或者蠕虫. 简单来讲,爬虫就是一个探测机器 ...

  5. 买不到口罩怎么办?Python爬虫帮你时刻盯着自动下单!| 原力计划

    作者 | 菜园子哇 编辑 | 唐小引 来源 | CSDN 博客 马上上班了,回来的路上,上班地铁上都是非常急需口罩的. 目前也非常难买到正品.发货快的口罩,许多药店都售完了. 并且,淘宝上一些新店口罩 ...

  6. python爬虫怎么挣钱_买不到口罩怎么办?Python爬虫帮你时刻盯着自动下单!| 原力计划...

    作者 | 菜园子哇编辑 | 唐小引来源 | CSDN 博客马上上班了,回来的路上,上班地铁上都是非常急需口罩的.目前也非常难买到正品.发货快的口罩,许多药店都售完了.并且,淘宝上一些新店口罩库存写着非 ...

  7. python爬虫之壁纸的下载

    python爬虫之壁纸的下载 好久没有写博客了,暑假这段时间在学校里面忙着写小论文,没机会写我最喜欢的爬虫了(虽然很简单,但架不住哥喜欢...) 好了,废话不多说了,开始把 本次爬虫爬取的是 手机壁纸 ...

  8. Python爬虫—Scrapy框架—Win10下载安装

    Python爬虫-Scrapy框架-Win10下载安装 1. 下载wheel 2.下载twisted 3. 下载pywin32 4. 下载安装Scrapy 5. 创建一个scrapy项目 6. fir ...

  9. Python爬虫——利用Scrapy批量下载图片

    Python爬虫--利用Scrapy批量下载图片 Scrapy下载图片项目介绍 使用Scrapy下载图片 项目创建 项目预览 创建爬虫文件 项目组件介绍 Scrapy爬虫流程介绍 页面结构分析 定义I ...

最新文章

  1. 按下enter键在各个文本框中切换焦点_你真的了解Enter键吗?请先学习本文后再回答...
  2. 22种代码坏味道及重构手段
  3. iOS定义静态变量、静态常量、全局变量
  4. 汽车全景标定(拼接)效果的检验方法
  5. 文巾解题 10. 正则表达式匹配
  6. 【深度学习的数学】“2×4×1层带sigmoid激活函数的神经网络感知机对三角形平面的分类训练预测”,输出层加偏置b(实时绘制损失函数曲线)(对输入数据归一化)(奇迹出现了!)
  7. 身为最热门的编程语言,Java求职前景到底如何?
  8. python基本运算_python中的基本运算
  9. java 复印件效果_简历复印—原型模式
  10. 书屋(一):读《世界是平的》有感
  11. D3可视化:(2)Bar Chart with D3js
  12. Bailian2871 Bailian3682 整数奇偶排序【排序】
  13. js里css不起作用,CSS文件在NODE js中不起作用
  14. Linux安装MATLAB Compiler Runtime操作
  15. 窗体点击,空白处隐藏(stopPropagation)
  16. zoiper 软件_zoiper软件下载
  17. 在线暴躁:script /问题
  18. Stm32F4XX开启FPU浮点运算
  19. 作为一个程序员,如何保持优秀
  20. yt-dlp教程如何下载高清视频

热门文章

  1. ITU-R BT.709诞生始末
  2. Python实现TCP客户端和服务器(多线程)
  3. WR703N路由器资料
  4. 重学Java(035)——Java基础知识(类作为成员变量、接口作为成员变量、接口作为方法参数和返回值类型)
  5. linux 跨机器执行shell,使用DSH(分布式Shell)在多台机器上运行Linux命令
  6. (转新浪)深锐观察:科比OMG 一个只想赢的强迫症患者的故事
  7. 40.古人建造都城在风水上有何讲究?
  8. excel中的函数公式使用方法
  9. 繁殖饲养孔雀鱼-精华篇
  10. 微信小程序分包和预加载分包