import requests
import re
import os
import urllib.request
import time
# 下载视频
def download():k = 1while k <= 2:# 获取网页源代码url = "http://www.budejie.com/video/{0}".format(k)# 模拟浏览器去请求服务器headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0'}# 状态码html = requests.get(url, headers=headers)# 获取视频id   .*?匹配所有reg = 'data-mp4="(.*?)"'video_url = re.findall(reg, html.text)name = '<div class="j-video-c" data-title="(.*?)"</div>'video_name = re.findall(name, html.text)k += 1print(video_url)print(video_name)for i in video_url:print('正在下载视频%s' % i)path = 'video'if not os.path.exists(path):os.makedirs(path)file_path = path + '/%s' % i.split('/')[6] + ".mp4"urllib.request.urlretrieve(i, file_path)
download()

爬取结果:
![](https://img-blog.csdnimg.cn/20191121133849124.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzQ0NDc5NDAz,size_16,color_FFFFFF,t_70
项目源代码请点击这里

爬虫 爬取百思不得姐网站相关推荐

  1. python网络爬虫_Python网络爬虫——爬取视频网站源视频!

    原标题:Python网络爬虫--爬取视频网站源视频! 学习前提 1.了解python基础语法 2.了解re.selenium.BeautifulSoup.os.requests等python第三方库 ...

  2. 爬虫爬取二次元网站美女图片

    爬虫爬取二次元网站美女图片 前言 xpath解析 需求分析 代码编写 总代码 前言 本次需要爬取二次元网站cos板块下的图片 需要用到request模块与lxml模块,所以请提前安装好这两个模块,打开 ...

  3. python怎么爬网站视频教程_python爬虫爬取某网站视频的示例代码

    把获取到的下载视频的url存放在数组中(也可写入文件中),通过调用迅雷接口,进行自动下载.(请先下载迅雷,并在其设置中心的下载管理中设置为一键下载) 实现代码如下: from bs4 import B ...

  4. mysql scrapy 重复数据_大数据python(scrapy)爬虫爬取招聘网站数据并存入mysql后分析...

    基于Scrapy的爬虫爬取腾讯招聘网站岗位数据视频(见本头条号视频) 根据TIOBE语言排行榜更新的最新程序语言使用排行榜显示,python位居第三,同比增加2.39%,为什么会越来越火,越来越受欢迎 ...

  5. 在anaconda下创建我的第一个scrapy爬虫——爬取dmoz网站某一网址下的目录的链接名称以及链接地址...

    这里我用的python工具是anaconda. 1.首先创建一个scrapy工程: 打开anaconda promt命令行(注意这里不是使用cmd打开windows下的命令行),进入到需要创建工程的目 ...

  6. Jsoup学习 JAVA爬虫爬取美女网站 JAVA爬虫爬取美图网站 爬虫

    最近对爬虫起了兴趣,但是网上都说做爬虫最好得语言是py.但是我只会java,所以就想能不能用java实现一个爬虫,百度搜索发现,其实java也有很多优秀得开源爬虫框架,包括Gecco,webmagic ...

  7. python爬虫爬取某网站图片

    学习分享 | 今天刚学完爬虫,就随便写了一个爬虫代码爬取某网站的图片 网站就是这个图片网站,我选的是1080p格式,4k的要会员,我反正是还不会 导入的包如下 import requests from ...

  8. 爬虫爬取相亲网站信息

    项目背景:男女人数差过大,导致大部分适合结婚的男女没有找到心仪的另一半,可以选择通过各种相亲网站,但网站上面的信息过多而且需要会员才能获取到联系方式,因此我们项目主要是通过爬取相亲网站(在此采用我主良 ...

  9. python爬虫爬取小说网站并转换为语音文件

    前言 作为一个技术宅,本着为眼睛着想的角度考虑,能少看屏幕就尽量少看屏幕,可是又是一个小说迷,那就开动脑筋爬一下小说转换成语音来听书吧 第一章:爬取小说文件 把目标定在小说存储量比较大的网站:起点中文 ...

  10. python爬虫爬取58网站数据_python实战学习笔记:爬取58同城平板电脑数据

    学习爬虫一周后独立完成的第一个作业项目:爬取58同城平板电脑数据. 1.首先确定URL,并抓取详情页中需要的信息 首先我们确定好需要爬取的网页URL是:http://zhuanzhuan.58.com ...

最新文章

  1. 英特尔的指令集体系结构_对标英特尔的RISC-V大有可为,CPU三分天下格局可期
  2. css表格文字超数量就竖排_绝了,超轻量级中文 OCR,你值得拥有
  3. git 查看某个文件的历史记录
  4. zkcli远程连接_ZooKeeper 学习笔记(二)-API 操作和应用
  5. Android使用WebView加载网页
  6. javascript简介及基本语法
  7. 【题解】JSOIWC2019 Round4
  8. 如何在php中写内容,请问如何在内容模板中写标题和内容呢
  9. mybatis的Example[Criteria]的使用
  10. linux强实时,强实时性Linux内核的研究与设计
  11. eBPF 学习路径总结
  12. 变步长梯形法与龙贝格算法
  13. Hadoop、Zookeeper、Hbase分布式安装教程
  14. 使用grub2制作U盘启动盘安装操作系统
  15. 《职场动物进化手册》笔记整理
  16. Python3迅雷vip账号批量抓取导入excel中
  17. 基于MTCNN+arcface的人脸检测和人脸识别
  18. jason表情包在线生成源码
  19. 互联网日报 | 1月27日 星期三 | 支付宝集五福活动2月1日开启;华为否认“出售手机业务”传闻;中国联通自有手机品牌发布...
  20. 模拟IC设计——简单放大器的直流仿真

热门文章

  1. 几种经典的下肢力量练习方式
  2. python培训班靠谱吗-python编程培训 python培训靠谱吗
  3. 云服务器防 DDoS 攻击的几种方法策略分享
  4. magicyang语录
  5. win10 纯净版系统如何添加字体的方法
  6. modelsim error:iteration limit reached at time xxx ns.
  7. Atcoder ARC093F : Dark Horse
  8. 笔记本w ndows未能启动,Windows未能启动原因可能是最近更改了硬件或软件解决方法...
  9. Spring Data JPA + QueryDSL
  10. LeetCode114--词典中最长的单词、最短补全词、宝石与石头