前言

短视频流行起来可不是一年两年了,现在很多年轻人都在玩短视频,有些的单纯就是看看,而有些的就是自己发视频

我每天刷视频,一刷就停不下来,应该还是有蛮多人跟我一样的吧

那有没有想法用自己所学的python知识,实现一下采集这些视频内容呢

今天就给你们分享一下,如何用python批量采集某短视频内容【并且无水印】

环境准备

环境使用

  • Python 3.8
  • Pycharm

模块使用

  • requests >>> pip install requests
  • selenium >>> pip install selenium==3.141.0 <需要浏览器和浏览器驱动>
  • re
  • json

代码实现

导入模块

源码.点击领取即可

import requests
import re
import json
from pprint import pprint
from selenium import webdriver
import time

创建浏览器对象, 实例化对象 自动打开浏览器

driver = webdriver.Chrome()

访问网址

driver.get('https://****.com/user/MS4wLjABAAAAQcVVV9POy-3J4FjXQfZGrFEOyzsri0KpKu3UdIVu72M')

执行页面滚动的操作

def drop_down():for x in range(1, 40, 4):  # 1 3 5 7 9  在你不断的下拉过程中, 页面高度也会变的time.sleep(1)j = x / 9  # 1/9  3/9  5/9  9/9# document.documentElement.scrollTop  指定滚动条的位置# document.documentElement.scrollHeight 获取浏览器页面的最大高度js = 'document.documentElement.scrollTop = document.documentElement.scrollHeight * %f' % jdriver.execute_script(js)

可以直接定位元素提取内容

lis = driver.find_elements_by_css_selector('.Eie04v01')
for li in lis:url = li.find_element_by_css_selector('a').get_attribute('href')

1. 发送请求

print(url)
time.sleep(1)

模拟伪装

 headers = {# user-agent 用户代理 表示浏览器基本身份信息'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36'}

发送请求

response = requests.get(url=url, headers=headers)

2. 获取数据

获取服务器返回响应数据
开发者工具: response <网页源代码>

3. 解析数据

提取我们想要的数据内容

视频标题

视频播放链接

python学习交流Q群:309488165 ### 源码领取# 提取标题title = re.findall('<title data-react-helmet="true">(.*?)</title>', response.text, re.S)[0]# 替换一下特殊字符title = re.sub(r'[\/:*?"<>|\n]', '', title)# 提取视频信息video_info = re.findall('<script id="RENDER_DATA" type="application/json">(.*?)</script', response.text)[0]# 数据进行解码html_data = requests.utils.unquote(video_info)# 转换数据类型json_data = json.loads(html_data)# 键值对取值, 根据冒号左边的内容[键], 提取冒号右边的内容[值]video_url = 'https:' + json_data['41']['aweme']['detail']['video']['bitRateList'][0]['playAddr'][0]['src']print(title)print(video_url)

4. 保存数据

video_content = requests.get(url=video_url, headers=headers).content
with open('video\\' + title + '.mp4', mode='wb') as f:f.write(video_content)

最后

朋友们学习python,有时候不知道怎么学,从哪里开始学。掌握了基本的一些语法或者做了两个案例后,不知道下一步怎么走,不知道如何去学习更加高深的知识。
那么对于这些朋友们,我准备了大量的免费视频教程,PDF电子书籍,以及源代码!直接在文末名片自取即可哦!

今天的分享到这里就结束了

顺便给大家推荐一些Python视频教程,希望对大家有所帮助:

Python零基础教学合集

对文章有问题的,或者有其他关于python的问题,可以在评论区留言或者私信我哦
觉得我分享的文章不错的话,可以关注一下我,或者给文章点赞(/≧▽≦)/

Python批量采集无水印短视频内容相关推荐

  1. 全网功能最全的无水印短视频提取工具

    介绍: 视频下载简介:全网功能最全的无水印短视频提取工具,只要输入短视频链接,即可一键下载超多的无水印视频哦,欢迎下载体验! 网盘下载地址: https://zijiewangpan.com/8SJk ...

  2. 学习python很无趣?看看这篇文章教你采集无水印美女视频(含视频教程)

    前言 嗨嗨,大家下午好 ~ 我又来给你们送福利了嘿嘿 今天教你们如何用python实现批量采集美女视频 ~ 小声说:这次还有视频教程! 正文 环境使用 Python 3.8 Pycharm 谷歌浏览器 ...

  3. Python批量采集亚马逊商品数据 (含完整源代码)

    前言 嗨喽 ! 大家好吖,这里是魔王~ 亚马逊公司,是美国最大的一家网络电子商务公司,位于华盛顿州的西雅图 是网络上最早开始经营电子商务的公司之一,亚马逊成立于1994年 今天教大家用Python批量 ...

  4. python爬app无水印视频_Python爬虫:短视频平台无水印下载 (上)

    导入: 虽然目前有些软件还没适配,但是,我发了 Blink 后有一写人留言或者私信找我要源码,不过我还在增加适配的软件,所以还没有时间写这篇博客,今天呢,就先把我目前适配了的代码拿出来,后续还会继续适 ...

  5. 抖音一键批量下载无水印视频,这款软件帮助你

    前言 上次分享了安卓端下载抖音无水印小视频,但是总有些人不满足,比如上次分享的软件苹果手机不能直接下载无水印视频,需要用链接去解析,而且手机一个个下载太麻烦?咋办?这款小神器让你一键批量下载无水印抖音 ...

  6. 快手视频搬运快手视频伪原创工具快手视频消重快手去重的软件短视频消重批量处理软件,短视频伪原创...

    快视频,安卓修改视频md5批量自动去水印加水印软件 今日头条自媒体视频,视频消重是什么批量自动去水印加水印软件 快视频,视频消重原理去水印去logo字幕工具 搜狐自媒体视频,搬运视频修改md5批量自动 ...

  7. python 短视频剪辑_视频剪辑什么鬼?Python 带你高效创作短视频

    这里将告诉您视频剪辑什么鬼?Python 带你高效创作短视频,具体完成步骤: 近两年,抖音.快手将短视频推到风口浪尖上,要生产出高质量的视频,离不开视频剪辑这一环节:在全民剪片浪潮中,大众使用最多的剪 ...

  8. python ffmpeg剪辑视频_视频剪辑什么鬼?Python 带你高效创作短视频

    原标题:视频剪辑什么鬼?Python 带你高效创作短视频 本文转自『AirPython』 近两年,抖音.快手将短视频推到风口浪尖上,要生产出高质量的视频,离不开视频剪辑这一环节:在全民剪片浪潮中,大众 ...

  9. Python爬虫:多平台短视频去水印下载器

    Python爬虫:多平台短视频去水印下载器 功能介绍 各平台分解 抖音 快手 微视 皮皮搞笑 总结 源码仓库 本教程描述的爬取方案定档与2020年10月26日 郑重申明:该文章介绍的技术仅供用于学习, ...

最新文章

  1. wpf 对控件进行截图,获取快照
  2. 20135302魏静静——linux课程第六周实验及总结
  3. 拉取网页_用命令行管理你的 GitHub 项目,不必再开网页,官方 CLI 工具 1.0 版上线...
  4. Oracle --DML、DDL、DCL
  5. 程序员眼中的统计学(3)】概率计算:把握机会
  6. docx4j书签的妙用
  7. idea 修改工作空间
  8. 面试题——————JAVA完成人民币大写转化
  9. 单片机---HLK-W801移植Nes模拟器(二)
  10. 2014年服装设计短训班(周末班)招生简章-北京服装学院培训中心
  11. MacOS 安装 MySQL
  12. 最小函数值(minval)
  13. 康奈尔大学计算机生物学是,康奈尔大学计算生物学难进吗?
  14. Javafx 实现国际象棋游戏
  15. pvlan与vlan的区别是什么?
  16. Python 并行编程教程 | Lynda教程 中文字幕
  17. [Android] Android 6.0 动态权限申请看完就会写
  18. 人脸识别小区门禁系统_住宅小区的人脸识别门禁如何运作?
  19. cocosCreator 接广告 穿山甲 Topon 聚合平台
  20. java性别_java中的性别字段

热门文章

  1. 从Antd 源码到自我实现之 Form表单
  2. PyTorch深度学习(18)网络结构LeNet、AlexNet
  3. 创意h5案例作品展示:谁是王牌拆弹专家
  4. 程序员武器之键盘,适用于其他文字录入者
  5. day08 系统篇端口扫描CDN服务负载均衡WAF防火墙
  6. css中图片在div中的位置,纯CSS实现任意图片在div中垂直居中
  7. 第一部份1:JMF基础原理与相关术语介绍 。。。。快速了解JMF有什么相关内容
  8. 什么是“荷花定律”?
  9. 2012刚流行的段子
  10. Java编程答题游戏