兄弟姐妹们!又到了化身曹贼的时间!冲鸭!

今天咱们把这个网站上的小姐姐小哥哥都给爬下来,当然你学会了去爬啥那就都随便了~

环境模块
用到的环境是Python3.6和pycharm
需要安装两个模块,requests和re模块,还会用到一个pprint模块,这个是内置的,不用安装,咱们直接调用就可以了。

代码部分
大概的意思都写在注释了,就不一一解释了,让我们直接用代码说话,反正写的太详细了,你们也不看看,就喜欢代码…
但是考虑到有些小伙伴可能零基础,所以安排一波视频教程给你们吧!

import requests  # 模拟发送请求  # pip install requests
import pprint  # 格式化输出模块  内置模块
import re  # 正则表达式模块 专门用于字符串 匹配, 替换, 分割def change_title(title):new_title = re.sub('[\\\/\:\*\?\"\<\>\|]', '_', title)return new_titlefor page in range(6, 11):try:#打印的时候显示爬多少页print(f'=======================正在抓取第{page}页数据=========================')# 1. 找数据对应的url连接地址if page == 1:url = 'https://v.6.cn/minivideo/getMiniVideoList.php?act=recommend&page=1&pagesize=30'else:url = f'https://v.6.cn/minivideo/getMiniVideoList.php?act=recommend&page={page}&pagesize=25'# user-agent 浏览器的身份标识headers = {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.54 Safari/537.36'}# 2. 发送地址请求(包含了各种各样的数据)  ua 伪装    遇到请求不到数据的时候可以考虑伪装response = requests.get(url=url, headers=headers)# json数据: 数据返回的一种形式json_data = response.json()# pprint.pprint(json_data)# 3. 数据解析  字典: 数据容器data_list = json_data['content']['list']# print(data_list)# 数据类型  流程控制  数据容器 ...for data in data_list:title = data['title']  # 视频的标题  # mp4 avi rmvb flv awn...playurl = data['playurl']  # 视频地址# print(title, playurl)# 请求视频数据  视频数据  图片  音频  都属于二进制数据video_data = requests.get(url=playurl, headers=headers).contentnew_title = change_title(title)# 4. 数据的保存with open('video\\' + new_title + '.mp4', mode='wb') as f:f.write(video_data)print('保存完成:', new_title)except:continue

爬取结果
注意,这里没写自动创建文件,所以要自己先创建一个video文件和代码放到一起,不然没有结果的。
视频教程:

Python:批量爬取小哥哥小姐姐精品短视频,看的不亦乐乎!

不会安装模块的看这篇:如何安装python模块, python模块安装失败的原因以及解决办法

兄弟们,你的三连就是我的动力,能让我动力加满吗!

Python:20行代码爬取高质量帅哥美女视频,让你一次看个够相关推荐

  1. python 20行代码爬取王者荣耀全英雄皮肤

    引言 王者荣耀大家都玩过吧,没玩过的也应该听说过,作为时下最火的手机MOBA游戏,咳咳,好像跑题了.我们今天的重点是爬取王者荣耀所有英雄的所有皮肤,而且仅仅使用20行Python代码即可完成. 准备工 ...

  2. 简单20行代码爬取王者荣耀官网1080p壁纸

    简单20行代码爬取王者荣耀官网1080p壁纸 # -*- coding: utf-8 -*- # @Time : 2020/12/13 18:08 # @Author : ningfangcong i ...

  3. python:利用20行代码爬取网络小说

    文章目录 前言 一.爬虫是什么? 二.实现过程 总结 提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 前言 今天,来给大家一个分享一下如何使用20爬虫行代码爬取网络小说(这里我们以龙 ...

  4. 20行代码爬取王者荣耀全英雄皮肤!让你享受白嫖的快乐!

    引言 王者荣耀大家都玩过吧,没玩过的也应该听说过,作为时下最火的手机MOBA游戏,咳咳,好像跑题了.我们今天的重点是爬取王者荣耀所有英雄的所有皮肤,而且仅仅使用20行代码即可完成. 准备工作 爬取皮肤 ...

  5. python爬取付费直播的视频_教你用20行代码爬取直播平台弹幕(附源码)

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. Python爬虫.数据分析.网站开发等案例教程视频免费在线观看 https://space. ...

  6. python获取虎牙弹幕_教你用20行代码爬取直播平台弹幕(附源码)

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. Python爬虫.数据分析.网站开发等案例教程视频免费在线观看 https://space. ...

  7. python爬虫-20行代码爬取王者荣耀所有英雄图片,小白也轻轻松松

    1.环境 python3.6 需要用到的库: re.os.requests 2.简介 王者荣耀可以算得上是比较受欢迎的手游之一了,应该有不少的人都入坑过农药,我们今天的目的就是要爬取王者荣耀的高清英雄 ...

  8. python爬虫爬取图片代码_python爬虫-20行代码爬取王者荣耀所有英雄图片,小白也轻轻松松...

    1.环境python3.6 需要用到的库: re.os.requests 2.简介 王者荣耀可以算得上是比较受欢迎的手游之一了,应该有不少的人都入坑过农药,我们今天的目的就是要爬取王者荣耀的高清英雄壁 ...

  9. 20行代码爬取原神角色全图

    python爬取原神官网所有角色的全身图 需要的工具 python环境 原神首页链接 https://ys.mihoyo.com/main/ 一个.py文件 话不多说,直接开整 用到的库有 impor ...

  10. 一看就会的20行代码爬取豆瓣读书Top250

    想入门Python爬虫,大家都喜欢拿爬取豆瓣读书Top250为例子来练手. 下面我就给大家分享一个简单的爬虫. 1.确定所需库 首先我们要确定需要引入的库. 要爬取网页的数据,当然要发送请求啦,所以我 ...

最新文章

  1. webBrowse无法正常显示Excel
  2. div+css命名规范大全
  3. 设置Qt应用程序图标
  4. How is setModel triggering propery binding
  5. 超形象!流体版的勾股定理演示动图...
  6. java处理url中的特殊字符%等
  7. Windows Server AppFabric缓存参考实例和方案选择 2/3
  8. TechNet Magazine/TechNet杂志
  9. ae 的动画导出为html,Bodymovin v5.5.3 – AE导出Web动画插件+使用教程
  10. 基于spss的偏相关分析(partial correlation analysis)
  11. 十个随机数排列(vb代码)
  12. 数字图像处理——Sobel算子锐化、Prewitt算子锐化
  13. JSPL中用fn:contains()判断list中是否包含某个值
  14. VIJOS P1540 月亮之眼
  15. HaaS轻应用(Python): 使用“千里传音“服务打造您的专属云喇叭
  16. 【TUG 话题探讨003】TUG 专家们如何做 TiDB 性能调优
  17. 《Fast Online Object Tracking and Segmentation: A Unifying Approach》
  18. 【第89期】推荐几本电商必读书
  19. html格式发邮件,怎么用HTML格式发送邮件.既怎么发HTML格式的邮件?
  20. 使用PayPal收款要注意哪些细节?

热门文章

  1. maya餐具图片_有哪些价格低但是逼格高很文艺又实用的物品呢?
  2. MQ如何快速实现流量削峰填谷
  3. webgl中顶点着色器的varying变量,使用方法。
  4. 重磅开源!平安产险提出TableMASTER:表格识别大师
  5. 详解Excel中最常用的查找公式Vlookup及Sumifs
  6. matlab如何绘制语谱图,语谱图matlab
  7. 扣扣机器人唱歌_qq小冰唱歌指令生成器下载-qq小冰唱歌关键字命令生成器 _5577安卓网...
  8. Linux基础:破解root密码(rd.break)
  9. 读入一系列正整数数据,输入-1表示输入结束,-1本身不是输入的数据。程序输出读到的数据中的奇数和偶数的个数。
  10. ElasticSearch 7.X的基础教程二(Es安装教程)