把获取到的下载视频的url存放在数组中(也可写入文件中),通过调用迅雷接口,进行自动下载。(请先下载迅雷,并在其设置中心的下载管理中设置为一键下载)

实现代码如下:

from bs4 import BeautifulSoup
import requests
import os,re,time
import urllib3
from win32com.client import Dispatch
class DownloadVideo:def __init__(self):self.r = requests.session()self.url=self.get_url()self.download_urla=[]self.download_urlb=[]self.url_set=["%s/shipin/list-短视频.html"%self.url]#获取最新网址def get_url(self):urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)a=self.r.get(\'https://www.k58.com\',verify=False)b=a.urlreturn b#几页内容的网址def url_set1(self,n):if n==2:url="%s/shipin/list-短视频-2.html"%self.urlself.url_set.append(url)elif n>=3:m=n+1for i in range(2,m):url="%s/shipin/list-短视频-%d.html"%(self.url,i)self.url_set.append(url)else:pass#分别加载每一个页内容的网址def download_url1(self):for j in self.url_set:urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)r=self.r.get(j,verify=False)sp1=r.contentsoup = BeautifulSoup(sp1, "html.parser")sp2 = soup.find_all(class_="shown")for i in sp2:url1=re.findall(\'<a href="(.*?)"\',str(i))u=self.url+url1[0]self.download_urla.append(u)#分别获取各个视频的下载链接def download_url2(self):for i in self.download_urla:urllib3.disable_warnings(urllib3.exceptions.InsecureRequestWarning)r=self.r.get(i,verify=False)sp1=r.contentsoup = BeautifulSoup(sp1, "html.parser")sp2 = soup.find_all(class_="form-control input-sm copy_btn app_disable")for j in sp2:url2=j["data-clipboard-text"]self.download_urlb.append(url2)#将链接写入txt中# self.write_txt(url2)#迅雷下载def thunder_download(self):try:thunder = Dispatch("ThunderAgent.Agent64.1")for i in self.download_urlb:thunder.AddTask(i)thunder.CommitTasks()time.sleep(2)except:print("请下载迅雷,并在其设置中心的下载管理中设置为一键下载")def mkdir(self,path):folder = os.path.exists(path)if not folder:os.makedirs(path)else:passdef write_txt(self,c):self.mkdir(r"D:\AAAAA")file_name=time.strftime(\'%Y%m%d_%H%M%S.txt\')with open(r"D:\AAAAA\%s"%file_name,\'a\') as f:f.write(c+"\n")if __name__ == \'__main__\':d=DownloadVideo()#数字表示几页的内容d.url_set1(5)d.download_url1()d.download_url2()d.thunder_download()

python编程https://edu.csdn.net/course/detail/36170

python爬虫:爬取某网站视频相关推荐

  1. python怎么爬网站视频教程_python爬虫爬取某网站视频的示例代码

    把获取到的下载视频的url存放在数组中(也可写入文件中),通过调用迅雷接口,进行自动下载.(请先下载迅雷,并在其设置中心的下载管理中设置为一键下载) 实现代码如下: from bs4 import B ...

  2. Python爬虫 爬取腾讯视频评论内容

    Python爬虫 爬取腾讯视频评论内容 腾讯视频评论内容在源码里是不可见,所以要使用抓包分析. 可安装fiddler代理服务器实现. 下面爬了腾讯视频评论内容(不包括回复),及发表评论者的id.昵称和 ...

  3. python爬虫爬取某网站图片

    学习分享 | 今天刚学完爬虫,就随便写了一个爬虫代码爬取某网站的图片 网站就是这个图片网站,我选的是1080p格式,4k的要会员,我反正是还不会 导入的包如下 import requests from ...

  4. python爬虫爬取小说网站并转换为语音文件

    前言 作为一个技术宅,本着为眼睛着想的角度考虑,能少看屏幕就尽量少看屏幕,可是又是一个小说迷,那就开动脑筋爬一下小说转换成语音来听书吧 第一章:爬取小说文件 把目标定在小说存储量比较大的网站:起点中文 ...

  5. python爬虫爬取58网站数据_python实战学习笔记:爬取58同城平板电脑数据

    学习爬虫一周后独立完成的第一个作业项目:爬取58同城平板电脑数据. 1.首先确定URL,并抓取详情页中需要的信息 首先我们确定好需要爬取的网页URL是:http://zhuanzhuan.58.com ...

  6. Python爬虫—爬取某网站上面所有的世界港口信息数据

    最近学习了一段时间的Python基础语法后,写了一个爬取世界港口数据的爬虫,并且保存到SQL Server 数据库. 前提 公司之前有个需求是想监控集装箱如果进出某个港口的时候能给出信息提示,并且与海 ...

  7. python爬虫爬取58网站数据_Python爬虫,爬取58租房数据 字体反爬

    Python爬虫,爬取58租房数据 这俩天项目主管给了个爬虫任务,要爬取58同城上福州区域的租房房源信息.因为58的前端页面做了base64字体加密所以爬取比较费力,前前后后花了俩天才搞完. 项目演示 ...

  8. python爬虫招聘-Python爬虫-爬取招聘网站信息(一)

    学习内容,来源于百度搜索 工具及环境 1.python版本:python 3.7.3 2.安装工具:beautifulsoup 3.系统环境:Windows10 4.浏览器:chrome 网页分析 i ...

  9. python爬虫爬取某网站全站图片案列(源码全给可白漂,仅供学习使用,切勿用作非法用途)

    爬取后保存的图片效果图 步骤入下(三步): 先去要爬取的目标网站(https://pixabay.com/)去注册一个账号. 2.注册后登录,浏览器右键鼠标,打开检查,找到登录后的cookies值. ...

  10. python 小说cms系统_「博文小说网」Python爬虫爬取小说网站 - seo实验室

    博文小说网 #!/usr/bin/env Python # -*- coding: utf-8 -*- # @Author : Woolei # @File : book136_singleproce ...

最新文章

  1. HDU3791(二叉搜索树)
  2. PaddleOCR,一款文本识别效果不输于商用的Python库!
  3. js中json的添加和指定位置的删除
  4. C#设计模式(1)——单例模式
  5. HTTP状态码一览表(HTTP Status Code)
  6. 在Linux上编写并运行Python文件
  7. java web项目无xml配置,完全javaconfig方式参考资料
  8. 再见安卓 鸿蒙,安卓系统:鸿蒙系统,正式再见
  9. 在Activity启动过程中如何任务栈的栈顶是否是将要启动的Activity的实例
  10. 【Flink】Flink source后全过滤数据导致监控数据为0
  11. 互联网人必读 | 大数据思维的十大核心原理
  12. 阿里云 Debian 9.2 安装 Java Web 环境
  13. Android Studio安装以及Fetching android sdk component information超时的解决方案
  14. Huffman编码原理详解
  15. 第一至七次人口区县级普查-GIS人口数据集(最新)
  16. jquery easyui后台模板
  17. 斯托尔兹(Stolz)定理
  18. 计算机学院转会,2020年英超冬窗转会汇总,你主队的操作让你满意吗?
  19. 香港拼音--汉字对照表
  20. Cygwin——简介

热门文章

  1. hive 增加表字段语录_Hive改表结构的两个坑|避坑指南
  2. 太阳的光和灯光有什么区别_防蓝光眼镜的原理是什么,为什么这么多人用?
  3. 问题 | golang编程中的坑
  4. Windows 10 怎样管理已连接过的无线网?
  5. 分布式文件系统-HDFS(   HDFS全称是Hadoop Distributed System)
  6. Maven学习总结(54)——使用 git-commit-id-plugin 插件来管理项目发版
  7. oracle中长字符串长度吗,Oracle 字符串长度函数
  8. major头文件_第三讲,可选头文件格式,以及节表
  9. python 收发邮件_Python 【收发邮件】
  10. 万字长文带你看尽深度学习中的12种卷积网络