2023年批量下载和改名音频专辑(单页列表)

一、下载原理
1）找到目标音频的专辑网页，这里以 kite runner mp3为例。（需要自己找）
https://www.xi___ma___la_____ya.com/album/71718770

2）进入详细页（称为一次请求URL）（不需要自己找）

音频为m4a格式，不会立即返回。进入到详细页后，人工点击播放键，发送二次请求才能返回m4a，第二次请求包装在json格式中。（不需要自己找了，脚本自动找）
即 ‘data’ : { … ‘src’: ’ xxx.m4a’}

3）第二次请求时url的变化在于 id，格式如下
https://www.xi____ma_____la_____ya.com/revision/play/v1/audio?id=577233294&ptype=1
脚本自动查找如下tag，并分析出id和title，其中id用于组织每次的m4a请求url, 而title用于迅雷下载时自动改名。
a href=“/album/https://www.xi_____ma_____la_____ya.com/sound/593062498”>nineteen</a

二、代码如下

# -*- coding:utf-8 -*-
import requests
from bs4 import BeautifulSoup
import re
import os
from win32com.client import DispatchHeaders = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/103.0.0.0 Safari/537.36'
}def get_xima_url(url):wd_data = requests.get(url,headers=Headers)wd_data.encoding = 'UTF-8'soup = BeautifulSoup(wd_data.text,'lxml')return soupdef get_xima_json(url):wd_data = requests.get(url,headers=Headers)    return wd_data.json()    def get_m4a(url):m4a_soup = get_url(url)m4a_hrefs = m4a_soup.find_all("a",attrs={'href':True}) pattern = '/album/..*/sound/(\d+)'o = Dispatch("ThunderAgent.Agent64.1")  for alink in m4a_hrefs:#print(alink)res = re.match(pattern,alink['href'])        name = alink.stringif res is not None:id = res.group(1)m4a_url = "https://www.xi_____ma____la____ya.com/revision/play/v1/audio?id=" + id + "&ptype=1"json = get_xima_json(m4a_url)m4a = json['data']['src']o.AddTask(m4a, name)o.CommitTasks()           #<a href="/album/https://www.xi____ma____la____ya.com/sound/593062498"><span class="title b_t">nineteen</span></a>
if __name__ == '__main__':url = "https://www.ximalaya.com/album/71718770"get_m4a(url)

说明一：
m4a_hrefs = m4a_soup.find_all(“a”,attrs={‘href’:True}) 可以过滤掉不需要的tag a。

三、如何用于自己感兴趣的内容下载
只需要修改倒数第二行的url最后的数字为你找到的专辑目录网页对应的数字。

2023年批量下载和改名音频专辑(单页列表)相关推荐

2023年批量下载和改名音频专辑(多页列表)
一.下载原理多页列表,有get类型的,有post类型的,xima的专辑多页列表属于get类型. 比如"https://www.xi__mala__ya.com/album/262212&q ...
2023年批量下载和改名音频专辑(系列3之selenium-wire方式)
XIMA多页动态列表中的音频下载seleniumwire 步骤说明: 步骤一:获取xima cookie 步骤二:遍历目录,逐一播放后抓取响应信息除了系列1之单页,系列2之多页,VIP音频还有动态加 ...
批量下载和改名21世纪英文报学生周报听力
批量下载和改名21世纪英文报学生周报听力如何找到音频痛点 python批量下载和改名如何找到音频建议使用 google chrome浏览器. https://www.i21st.cn/ 导航横 ...
nodejs虾米音乐批量下载某个歌手的专辑
使用nodejs 批量下载虾米音乐的方法. 使用到的工具 fs,cheerio,request,redis; 模块作用 fs 主要完成建立目录和文件的功能 request 用于进行访问url ch ...
python网上批量下载表格_python爬虫智能翻页批量下载文件的实例详解
python爬虫遇到爬取文件内容时,需要一页页的翻页爬取,这样很是麻烦,其实可以获取每个列表信息下的文件名和文件链接,让文件名和文件链接处理为列表,保存后下载,实现智能翻页批量下载文件,本文以以京客隆 ...
网店描述页详情页产品图片批量下载提取采集软件
1688描述页详情页产品图片批量下载提取采集软件阿里巴巴国际站描述页详情页产品图片批量下载提取采集软件淘宝描述页详情页产品图片批量下载提取采集软件天猫描述页详情页产品图片批量下载提取采集软件京 ...
新一配：perl循环调用python爬虫批量下载喜马拉雅音频
新一配:perl循环调用python爬虫批量下载喜马拉雅音频手机下载喜马拉雅音频后,获得的音频文件虽然可以转成mp3格式,但其文件名却是一长串字符串,无法辨别是哪一集,网上找了各种工具,都有局限性, ...
node.js 实现简单爬虫批量下载喜马拉雅音频
前提:最近一直在看node,平时碎觉喜欢听盗墓笔记啥的有声小说,然后突然就就想试着写个爬虫自己下载下来,虽然有点多此一举,但是就当学习练练手了,在这里记录一下! 没有express基础的,请先行了解 ...
利用Python编写脚本批量下载公众号中的音频
欢迎大家光临我的博客,大家一起交流学习哦陈京九的博客首先声明我只是一个小菜鸡,把自己琢磨一些功能的过程发到了这里当做记录,希望大神们轻喷,能给我一些指导就更好啦~ 上一篇博客教大家下载了公众号中的 ...

2023年批量下载和改名音频专辑(单页列表)

2023年批量下载和改名音频专辑(单页列表)相关推荐

最新文章

热门文章