#python爬虫实战-爬取视频网站下载视频至本地(selenium)

import requests
from lxml import etree
import json
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
import timeheaders={'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36',
}
max_behot_time=0
video_list=[]
def get_json():global max_behot_timeurl='http://www.365yg.com/api/pc/feed/?min_behot_time='+str(max_behot_time)r=requests.get(url,headers=headers)obj=json.loads(r.text)max_behot_time=obj['next']['max_behot_time']data=obj['data']for video_data in data:title=video_data['title']a_href='http://www.365yg.com'+video_data['source_url']down_video(title,a_href)def down_video(title,href):#通过selenium来解析视频网址,path=r'E:\Student\python\day05\driver\chromedriver.exe'chrome_options=Options()chrome_options.add_argument('--Headless')chrome_options.add_argument('--disable-gpu')chrome_options.add_argument('user-agent="Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.67 Safari/537.36"')browser=webdriver.Chrome(executable_path=path,chrome_options=chrome_options)browser.get(href)time.sleep(5)browser.save_screenshot(r'PjPhoto\baidu.png')#获取源码,生成对象,查找video 里面的srctree=etree.HTML(browser.page_source)video_url=tree.xpath('//video[@mediatype="video"]/@src')[0]video_url='http:'+video_urlfilepath='video/'+title+'.mp4'print('正在下载视频 %s'%title)r=requests.get(video_url)with open(filepath,'wb') as fp:fp.write(r.content)print('%s已下载'%title)browser.quit()def main():# page=int(input('请输入你要下载的页数(每页7个):'))page=1for x in range(0,page):get_json()if __name__ == '__main__':main()

python爬虫实战-爬取视频网站下载视频至本地(selenium)相关推荐

  1. Python爬虫实战爬取租房网站2w+数据-链家上海区域信息(超详细)

    Python爬虫实战爬取租房网站-链家上海区域信息(过程超详细) 内容可能有点啰嗦 大佬们请见谅 后面会贴代码 带火们有需求的话就用吧 正好这几天做的实验报告就直接拿过来了,我想后面应该会有人用的到吧 ...

  2. Python爬虫实战- 爬取整个网站112G-8000本pdf epub格式电子书下载

    (整个代码附在最后) 目录: 爬虫准备 - 某电子书网站内容架构分析 爬虫前奏 - 网站Html代码分析,如何获取需要的链接? 爬虫高潮 - 测试是否有反爬虫措施,测试是否能正常下载一个sample ...

  3. python爬虫实战---爬取大众点评评论

    python爬虫实战-爬取大众点评评论(加密字体) 1.首先打开一个店铺找到评论 很多人学习python,不知道从何学起. 很多人学习python,掌握了基本语法过后,不知道在哪里寻找案例上手. 很多 ...

  4. python爬虫实战-爬取微信公众号所有历史文章 - (00) 概述

    http://efonfighting.imwork.net 欢迎关注微信公众号"一番码客"获取免费下载服务与源码,并及时接收最新文章推送. 最近几年随着人工智能和大数据的兴起,p ...

  5. 初次尝试python爬虫,爬取小说网站的小说。

    本次是小阿鹏,第一次通过python爬虫去爬一个小说网站的小说. 下面直接上菜. 1.首先我需要导入相应的包,这里我采用了第三方模块的架包,requests.requests是python实现的简单易 ...

  6. python爬虫实战--爬取猫眼专业版-实时票房

    小白级别的爬虫入门 最近闲来无事,发现了猫眼专业版-实时票房,可以看到在猫眼上映电影的票房数据,便验证自己之前学的python爬虫,爬取数据,做成.svg文件. 爬虫开始之前 我们先来看看猫眼专业版- ...

  7. python爬虫 亲手爬取图书网站

    这个爬虫只是一个简单的爬虫,单线程并且任务的管理等 一 爬虫数据持久化方式 使用的是mysql数据库.需要设备上先安装mysql数据库,python中使用mysql 数据库的方法是使用pymysql库 ...

  8. python爬虫:爬取某网站视频

    把获取到的下载视频的url存放在数组中(也可写入文件中),通过调用迅雷接口,进行自动下载.(请先下载迅雷,并在其设置中心的下载管理中设置为一键下载) 实现代码如下: from bs4 import B ...

  9. python爬虫实战-爬取新闻联播视频和新闻文稿

    一.爬取新闻联播视频 1. 将视频拖到最后 2. 分析视频缓存链接 如图所示url:https://hls.cntv.baishancdnx.cn/asp/hls/1200/0303000a/3/de ...

最新文章

  1. VS2010与Qt设置出现红线提示
  2. jdeveloper_在JDeveloper 12.1.3中为WebSocket使用Java API
  3. 【Matlab】parfor并行运算如何显示进度条?
  4. 线性规划总结3——单纯形法和对偶单纯形法
  5. 把数据存入excel文件_Python从原Excel表中抽出数据存入同一文件的新的Sheet(实例53)...
  6. hdu 4279 Number
  7. linux nginx 安装stream,Centos7-64bit-编译安装配置Nginx stream四层负载均衡 动态加载
  8. 兼容超大图片的处理_N年都没弄明白!PS保存的图片格式都啥意思?
  9. 关闭Visual Studio 实时调试器
  10. php操作mysql数据库的扩展有哪些_PHP使用PDO扩展操作mysql数据库
  11. 第九届山东理工大学ACM网络编程擂台赛 F题题解
  12. 苹果App Store 四年历程回顾
  13. 网络摄像头RTSP流媒体协议视频平台EasyNVR如何进行延迟测试?
  14. 【课程】03 Richards方程数值解
  15. OS - 浅谈操作系统的内存管理
  16. 如何用c语言编写语音识别程序,使用C语言对文本进行语音识别
  17. Gym-101502J(取数博弈+dp)
  18. [几何画板]正十七边形的做法
  19. 2022年信息学部物联网工程学院学生科协第二次软件大培训
  20. Android 迷之Version管理

热门文章

  1. 【Spring 系列】Spring知识地图
  2. 使用Suricata和ELK进行网络入侵检测
  3. APK安装和卸载指令
  4. 类脑计算将何去何从?
  5. Java语言的发展历史
  6. javaScript基础面试题 --数据类型和考题
  7. 【历史上的今天】7 月 21 日:施乐退出计算机市场;《世界版权公约》制定;苹果推出 Apple Airport
  8. 第三次自考总结——时间管理和学习知识
  9. 大航海时代2卡特琳娜攻略(SFC日版)
  10. weex android 简书,Weex