需要用到的库

import os
import requests
from fake_useragent import UserAgent
import json
import re
import pprint

以及需要用到合成音频和视频的一个软件FFmpeg

FFmpeg下载参考教程

然后到我们的代码实现

import os
import requests
from fake_useragent import UserAgent
import json
import re
import pprint# 只下载 合成视频另外利用FFmpeg
ua = UserAgent()
#因为版权问题没有声明 这里是b#站视频url
url = input("请输入下载视频的网址url")header = {'user-agent': ua.chrome,'cookie': "buvid3=CFF66230-3E56-A189-9247-B05616FE9B0788580infoc; b_nut=1669435988; i-wanna-go-back=-1; b_lsid=FBD83BF6_184B2239B37; _uuid=B2B2A2F6-105110-88B1-848B-105D5C196310CA88800infoc; buvid4=026A855C-18D0-20F5-5FA7-119D934A2B0768759-022012508-bQg6aOCdw/QjUicgU95kvA%3D%3D; fingerprint=a877a9d4e7335ad9b9271f6b39fa9c8e; buvid_fp_plain=undefined; SESSDATA=867012e8%2C1684988005%2Cd8787%2Ab2; bili_jct=921f6a9b7d03a90d7fc89748aea4f40d; DedeUserID=507703146; DedeUserID__ckMd5=0a06cbbc99bc0cca; buvid_fp=91c4744a50648918c27547d565b6689d; bp_video_offset_507703146=732702986882515100; CURRENT_FNVAL=4048; sid=7sbhfwlu; theme_style=light; rpdid=|(m)mJ~kYmk0J'uYYmRJY|Yu; nostalgia_conf=-1; innersign=0; b_ut=5; PVID=1",'sec-ch-ua': '";Not A Brand";v="99", "Chromium";v="94"','sec-ch-ua-mobile': '?0','sec-ch-ua-platform': 'Windows','sec-fetch-dest': 'document','sec-fetch-mode': 'navigate','sec-fetch-site': 'none','sec-fetch-user': '?1','referer': 'https://space.bilibili.com/229733301/video'
}
response = requests.get(url=url, headers=header, timeout=3)
# 找到脚本里面视频和音频的url
html_data = re.findall('<script>window.__playinfo__=(.*?)</script>', response.text)[0]
# 转换成json数据
json_data = json.loads(html_data)
# pprint.pprint(json_data)
# 分别获取音频和视频数据
video_url = json_data['data']['dash']['video'][0]['base_url']
audio_url = json_data['data']['dash']['audio'][0]['base_url']
# print(response.text)# 找到页面里的标题
title = re.findall('<h1 title="(.*?)" class="video-title tit">', response.text)[0]video_info = [title, video_url, audio_url]
print("正在下载视频:", title)
# print(video_url)
# print(audio_url)# 获取二进制数据
# 音频
audio_content = requests.get(url=audio_url, headers=header).content
# 视频
video_content = requests.get(url=video_url, headers=header).contentwith open(title + '.mp3', mode='wb') as f:f.write(audio_content)
with open(title + '.mp4', mode='wb') as f:f.write(video_content)print("下载完成")

url就是某站视频上方那一段网址 复制输入进去就行了 最后下载得到两个音频和视频文件

这里我们利用ffmpeg合成

首先win+r 输入cmd 打开命令提示符 先cd到当前文件夹 然后输入代码ffmpeg-i {title}.mp4 -i {title}.mp3 {title}output.mp4 合成

title是文件名 最好的{title}output是输出的文件名 可以自己随意更改。

最后视频就合成好了 可以正常观看

ffmpeg软件功能其实很多 可以继续学习 有更多的效果。

python爬取某网站视频(简易实现易上手)相关推荐

  1. python怎么爬网站视频教程_python爬虫爬取某网站视频的示例代码

    把获取到的下载视频的url存放在数组中(也可写入文件中),通过调用迅雷接口,进行自动下载.(请先下载迅雷,并在其设置中心的下载管理中设置为一键下载) 实现代码如下: from bs4 import B ...

  2. python爬取bilibili弹幕_用Python爬取B站视频弹幕

    原标题:用Python爬取B站视频弹幕 via:菜J学Python 众所周知,弹幕,即在网络上观看视频时弹出的评论性字幕.不知道大家看视频的时候会不会点开弹幕,于我而言,弹幕是视频内容的良好补充,是一 ...

  3. python爬取抖音用户数据_使用python爬取抖音视频列表信息

    如果看到特别感兴趣的抖音vlogger的视频,想全部dump下来,如何操作呢?下面介绍介绍如何使用python导出特定用户所有视频信息 抓包分析 Chrome Deveploer Tools Chro ...

  4. python爬取m3u8格式视频

    python爬取m3u8格式视频 m3u8原理 脚本环境 爬取步骤 步骤的具体实现 python细节处理说明 参考代码 m3u8原理 当我们在网页播放视频时,网页向服务器发起一个以.m3u8结尾的连接 ...

  5. python爬取b站评论_学习笔记(1):写了个python爬取B站视频评论的程序

    学习笔记(1):写了个python爬取B站视频评论的程序 import requests import json import os table='fZodR9XQDSUm21yCkr6zBqiveY ...

  6. Python | 使用Python爬取Wallhaven网站壁纸并上传百度网盘

    更多详情请查看Honker Python | 使用Python爬取Wallhaven网站壁纸并上传百度网盘 给大家推荐一款超好用的壁纸下载网站-- wallhaven 第一次知道这个网站的时候,惊为天 ...

  7. 使用Python爬取马蜂窝网站的游记和照片

    使用Python爬取马蜂窝网站的游记和照片 特殊原因需要在马蜂窝上爬取一些游记和照片作为后续分析处理的数据,参考网上一些类似的爬虫文章,自己尝试了一下,这次爬取的是马蜂窝上所有有关苏州的游记(包括游记 ...

  8. Python爬取素材网站的音频文件

    这篇文章主要介绍了基于Python爬取素材网站音频文件,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下,另外我建立了一个Python学习圈子群:115 ...

  9. python爬b站评论_学习笔记(1):写了个python爬取B站视频评论的程序

    学习笔记(1):写了个python爬取B站视频评论的程序 import requests import json import os table='fZodR9XQDSUm21yCkr6zBqiveY ...

最新文章

  1. cv_bridge使用笔记
  2. linux的python2.7的paramiko_Python使用paramiko操作linux的方法讲解
  3. 使用Jmeter进行http接口测试
  4. can协议解析字符串的原理
  5. ubuntu16 redis5.0以前版本集群部署示例
  6. 基于 Go 的内置 Parser 打造轻量级规则引擎
  7. 扫盲,为什么分布式一定要有Redis?
  8. java面向字符的输入流_详细解读Java编程中面向字符的输入流
  9. phpcmsV9视频模块开发——盛大游戏通行证注册与密码找回
  10. WINDOWS操作系统中可以允许最大的线程数
  11. SAP License:PS中的成本控制
  12. MySQL中IN子查询会导致无法使用索引
  13. Uva 1471 Defense Lines(LIS变形)
  14. 基于jQuery动画二级下拉导航菜单
  15. ISO9001\ISO14001\OHSAS18001三体系快速认证申报须知
  16. unity3d 人物对话_Unity 3D游戏-NPC对话系统With XML
  17. oel安装中文环境,Linux UTC,CST时间及修改时间
  18. 新元宇宙每周连载《地球人奇游天球记》第十三回火星烧烤
  19. PYTHON对数值变量进行标准化,离散变量标签化
  20. Linux日志管理之搭建日志服务器

热门文章

  1. 独立游戏开发如何入门?
  2. 陈力:传智播客古代 珍宝币 泡泡龙游戏开发第48讲:PHP绘图技术
  3. 不可不知的“电子邮件”趣味历史!
  4. 前生殖器期和生殖期的差别?来自弗洛伊德的心理性欲发展阶段理论|小白心理-312/347考研答疑
  5. 廉价DSO Hantek 6022BL说明书上没有的内容
  6. 微信第 1 行代码曝光,还有多少个十年!
  7. 粒子群算法python_python实现粒子群算法
  8. 2022年5月中国数据库排行榜:openGauss 黑马首登顶,AntDB 冲进20强
  9. 新、改、扩建项目“三同时”安全管理制度
  10. 云计算解决方案架构师=售前?[新职业的浅析]