导包

import json,os
from piaot import *
from multiprocessing import Pooldef pqxs(shu=1):# 循环页数for i in range(1,shu+1):# 需要查询手动输入链接地址url="http://www.ximalaya.com/revision/album/getTracksList?albumId=12642314&pageNum="+str(i)# 调用了自定义包(开启代理和隐藏html头,返回2进制)req=yc(url)# 进行转码req=req.decode('utf-8')# 进行json解码html=json.loads(req)# 在返回的值里找到需要的数据a=html['data']['tracks']q=Pool(4)# 进行循环遍历for i in a:# 找到了每个小说的名称v=i['title']# 将值里取出后面的id编号(id为每个音频的连接条件)x=i['url'].split('/')[-1]# 将值里的《》标点符号去掉name = v.split('》')name = name[0].split('《')name=name[1]# 存储路径b = 'C:/Users/黑神/Desktop/pc_zy/喜马拉雅/' + name# 判断当前路径是否存在,没有则创建文件夹if not os.path.exists(b):print('正在创建文件夹:路径C:/Users/黑神/Desktop/pc_zy/'+name+'/')# 执行存储os.makedirs(b)print('创建成功....')# 音频链接地址url_xs = 'https://www.ximalaya.com/revision/play/tracks?trackIds='+str(x)# 音频存放的路径dz=b+'/'+v+'.m4a'print(v+'音频下载中.............')try:# 多进程下载zhi = q.apply_async(yc,(url_xs,))# 保存到文件with open(dz, 'wb') as f:f.write(zhi.get())print('(^-^)OK')except:print('( T _ T )NO')

if name == ‘main‘:
# 页数
pqxs(1)

[python爬虫]多进程爬取喜马拉雅音乐相关推荐

  1. Python爬虫:爬取喜马拉雅音频数据详解

    前言 喜马拉雅是专业的音频分享平台,汇集了有声小说,有声读物,有声书,FM电台,儿童睡前故事,相声小品,鬼故事等数亿条音频,我最喜欢听民间故事和德云社相声集,你呢? 今天带大家爬取喜马拉雅音频数据,一 ...

  2. python爬虫:爬取QQ音乐歌曲

    描述 可以下载QQ音乐免费音乐和绿钻音乐,但是不能下载付费音乐. 运行程序后会在同级目录自动创建名为:歌曲下载的文件夹,下载的文件将被放置在此文件夹 如果下载的文件大小为1KB,则表示下载失败,这首歌 ...

  3. python爬虫爬取音乐_利用python爬虫实现爬取网易云音乐热歌榜

    利用python爬虫实现爬取网易云音乐热歌榜 发布时间:2020-11-09 16:12:28 来源:亿速云 阅读:102 作者:Leah 本篇文章给大家分享的是有关利用python爬虫实现爬取网易云 ...

  4. Python3+scrapy 爬取喜马拉雅音乐 音乐和歌名 最简单的爬虫

    初学scrapy并爬取 喜马拉雅音乐想和大家分享分享 一 .分析数据 二 .分析完啦 话不多说 给各位看官上代码! 具体代码如下 这就是一个简单的爬虫爬取 喜马拉雅的歌曲 ? 本人仍在继续爬着!!!! ...

  5. Python爬虫之爬取酷狗音乐歌曲

    Python爬虫之爬取酷狗音乐歌曲 1.安装第三方库 在Python的语言库中, 分为Python标准库和Python的第三方库. Python标准库是在你安装Python的时候已经包含在了安装目录下 ...

  6. python爬取ajax动态内容肯德基门店,Python爬虫如何爬取KFC地址

    随着人们生活水平的提高,肯德基这类的快餐消费的十分火爆,成为小朋友和年轻人的最爱,我们到一个地方想要找到肯德基店面,会根据导航获取肯德基地址,那你知道我们也可以使用python爬虫获取KFC地址吗?我 ...

  7. python爬取网页表格数据匹配,python爬虫——数据爬取和具体解析

    标签:pattern   div   mat   txt   保存   关于   json   result   with open 关于正则表达式的更多用法,可参考链接:https://blog.c ...

  8. Python爬虫:爬取instagram,破解js加密参数

    Python爬虫:爬取instagram,破解js加密参数 instagram 是国外非常流行的一款社交网站,类似的还有像facebook.twitter,这些社交网站对于掌握时事热点.电商数据来源和 ...

  9. python爬取豆瓣电影top250_用Python爬虫实现爬取豆瓣电影Top250

    用Python爬虫实现爬取豆瓣电影Top250 #爬取 豆瓣电影Top250 #250个电影 ,分为10个页显示,1页有25个电影 import urllib.request from bs4 imp ...

最新文章

  1. 彩云国物语片头曲_はじまりの風
  2. 【攻防世界004】dmd-50
  3. Netty实战 IM即时通讯系统(七)数据传输载体ByteBuf介绍
  4. 有研究irrlicht引擎的吗,交流交流
  5. 二进制文件更新程序_APR 6.17程序文件更新
  6. QT安装和Hello,world
  7. 构建高可用linux和鸟哥,构建高可用Linux服务器
  8. iOS 10 推送的简单使用
  9. 《sqoop实现hdfs中的数据导出至mysql数据库》
  10. java 主流算法_java常用算法
  11. h3c 出口路由器mac地址过滤
  12. emlog5.3.1后台暴力破解
  13. 关于交换的知识点(一)
  14. Ribbon原理及使用详解
  15. <hr> 标签:定义水平线
  16. android studio signingconfigs 打正式包,Android-SigningConfigs打包配置
  17. 一个免费全格式MP3音乐播放器的工具
  18. CMOS反相器的工作原理和动态传输特性
  19. 【python数据类型】
  20. 生成对抗网络7日打卡营来了!GAN就对了!

热门文章

  1. CAD中插入外部参照字体会变繁体_为什么CAD图纸作为外部参照插入后有些文字消失?...
  2. 我在网上抢九价:有人过节送女友,有人被骗八千多
  3. 就业协议服务器是什么意思,什么是就业协议
  4. java 生成随机码 字符数字图片等
  5. OpenCV学习之基本概念
  6. eas bos客户端获取组织,人员,用户的方法
  7. 送给 xdm 的 10 个 web 在线前端资源,优雅永不过时~
  8. 2022年诺贝尔物理学奖的科学内涵辨识
  9. ANSYS workbench 根据坐标施加载荷- external data载荷映射
  10. 使用pandas读取excel表格如何去掉标题