Python:20行代码爬取高质量帅哥美女视频,让你一次看个够
兄弟姐妹们!又到了化身曹贼的时间!冲鸭!
今天咱们把这个网站上的小姐姐小哥哥都给爬下来,当然你学会了去爬啥那就都随便了~
环境模块
用到的环境是Python3.6和pycharm
需要安装两个模块,requests和re模块,还会用到一个pprint模块,这个是内置的,不用安装,咱们直接调用就可以了。
代码部分
大概的意思都写在注释了,就不一一解释了,让我们直接用代码说话,反正写的太详细了,你们也不看看,就喜欢代码…
但是考虑到有些小伙伴可能零基础,所以安排一波视频教程给你们吧!
import requests # 模拟发送请求 # pip install requests
import pprint # 格式化输出模块 内置模块
import re # 正则表达式模块 专门用于字符串 匹配, 替换, 分割def change_title(title):new_title = re.sub('[\\\/\:\*\?\"\<\>\|]', '_', title)return new_titlefor page in range(6, 11):try:#打印的时候显示爬多少页print(f'=======================正在抓取第{page}页数据=========================')# 1. 找数据对应的url连接地址if page == 1:url = 'https://v.6.cn/minivideo/getMiniVideoList.php?act=recommend&page=1&pagesize=30'else:url = f'https://v.6.cn/minivideo/getMiniVideoList.php?act=recommend&page={page}&pagesize=25'# user-agent 浏览器的身份标识headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.54 Safari/537.36'}# 2. 发送地址请求(包含了各种各样的数据) ua 伪装 遇到请求不到数据的时候可以考虑伪装response = requests.get(url=url, headers=headers)# json数据: 数据返回的一种形式json_data = response.json()# pprint.pprint(json_data)# 3. 数据解析 字典: 数据容器data_list = json_data['content']['list']# print(data_list)# 数据类型 流程控制 数据容器 ...for data in data_list:title = data['title'] # 视频的标题 # mp4 avi rmvb flv awn...playurl = data['playurl'] # 视频地址# print(title, playurl)# 请求视频数据 视频数据 图片 音频 都属于二进制数据video_data = requests.get(url=playurl, headers=headers).contentnew_title = change_title(title)# 4. 数据的保存with open('video\\' + new_title + '.mp4', mode='wb') as f:f.write(video_data)print('保存完成:', new_title)except:continue
爬取结果
注意,这里没写自动创建文件,所以要自己先创建一个video文件和代码放到一起,不然没有结果的。
视频教程:
Python:批量爬取小哥哥小姐姐精品短视频,看的不亦乐乎!
不会安装模块的看这篇:如何安装python模块, python模块安装失败的原因以及解决办法
兄弟们,你的三连就是我的动力,能让我动力加满吗!
Python:20行代码爬取高质量帅哥美女视频,让你一次看个够相关推荐
- python 20行代码爬取王者荣耀全英雄皮肤
引言 王者荣耀大家都玩过吧,没玩过的也应该听说过,作为时下最火的手机MOBA游戏,咳咳,好像跑题了.我们今天的重点是爬取王者荣耀所有英雄的所有皮肤,而且仅仅使用20行Python代码即可完成. 准备工 ...
- 简单20行代码爬取王者荣耀官网1080p壁纸
简单20行代码爬取王者荣耀官网1080p壁纸 # -*- coding: utf-8 -*- # @Time : 2020/12/13 18:08 # @Author : ningfangcong i ...
- python:利用20行代码爬取网络小说
文章目录 前言 一.爬虫是什么? 二.实现过程 总结 提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 前言 今天,来给大家一个分享一下如何使用20爬虫行代码爬取网络小说(这里我们以龙 ...
- 20行代码爬取王者荣耀全英雄皮肤!让你享受白嫖的快乐!
引言 王者荣耀大家都玩过吧,没玩过的也应该听说过,作为时下最火的手机MOBA游戏,咳咳,好像跑题了.我们今天的重点是爬取王者荣耀所有英雄的所有皮肤,而且仅仅使用20行代码即可完成. 准备工作 爬取皮肤 ...
- python爬取付费直播的视频_教你用20行代码爬取直播平台弹幕(附源码)
前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. Python爬虫.数据分析.网站开发等案例教程视频免费在线观看 https://space. ...
- python获取虎牙弹幕_教你用20行代码爬取直播平台弹幕(附源码)
前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. Python爬虫.数据分析.网站开发等案例教程视频免费在线观看 https://space. ...
- python爬虫-20行代码爬取王者荣耀所有英雄图片,小白也轻轻松松
1.环境 python3.6 需要用到的库: re.os.requests 2.简介 王者荣耀可以算得上是比较受欢迎的手游之一了,应该有不少的人都入坑过农药,我们今天的目的就是要爬取王者荣耀的高清英雄 ...
- python爬虫爬取图片代码_python爬虫-20行代码爬取王者荣耀所有英雄图片,小白也轻轻松松...
1.环境python3.6 需要用到的库: re.os.requests 2.简介 王者荣耀可以算得上是比较受欢迎的手游之一了,应该有不少的人都入坑过农药,我们今天的目的就是要爬取王者荣耀的高清英雄壁 ...
- 20行代码爬取原神角色全图
python爬取原神官网所有角色的全身图 需要的工具 python环境 原神首页链接 https://ys.mihoyo.com/main/ 一个.py文件 话不多说,直接开整 用到的库有 impor ...
- 一看就会的20行代码爬取豆瓣读书Top250
想入门Python爬虫,大家都喜欢拿爬取豆瓣读书Top250为例子来练手. 下面我就给大家分享一个简单的爬虫. 1.确定所需库 首先我们要确定需要引入的库. 要爬取网页的数据,当然要发送请求啦,所以我 ...
最新文章
- webBrowse无法正常显示Excel
- div+css命名规范大全
- 设置Qt应用程序图标
- How is setModel triggering propery binding
- 超形象!流体版的勾股定理演示动图...
- java处理url中的特殊字符%等
- Windows Server AppFabric缓存参考实例和方案选择 2/3
- TechNet Magazine/TechNet杂志
- ae 的动画导出为html,Bodymovin v5.5.3 – AE导出Web动画插件+使用教程
- 基于spss的偏相关分析(partial correlation analysis)
- 十个随机数排列(vb代码)
- 数字图像处理——Sobel算子锐化、Prewitt算子锐化
- JSPL中用fn:contains()判断list中是否包含某个值
- VIJOS P1540 月亮之眼
- HaaS轻应用(Python): 使用“千里传音“服务打造您的专属云喇叭
- 【TUG 话题探讨003】TUG 专家们如何做 TiDB 性能调优
- 《Fast Online Object Tracking and Segmentation: A Unifying Approach》
- 【第89期】推荐几本电商必读书
- html格式发邮件,怎么用HTML格式发送邮件.既怎么发HTML格式的邮件?
- 使用PayPal收款要注意哪些细节?
热门文章
- maya餐具图片_有哪些价格低但是逼格高很文艺又实用的物品呢?
- MQ如何快速实现流量削峰填谷
- webgl中顶点着色器的varying变量,使用方法。
- 重磅开源!平安产险提出TableMASTER:表格识别大师
- 详解Excel中最常用的查找公式Vlookup及Sumifs
- matlab如何绘制语谱图,语谱图matlab
- 扣扣机器人唱歌_qq小冰唱歌指令生成器下载-qq小冰唱歌关键字命令生成器 _5577安卓网...
- Linux基础:破解root密码(rd.break)
- 读入一系列正整数数据,输入-1表示输入结束,-1本身不是输入的数据。程序输出读到的数据中的奇数和偶数的个数。
- ElasticSearch 7.X的基础教程二(Es安装教程)