前言

嗨喽,大家好!这里是魔王

[课题]:

教你用 Python 看遍女神视界

[知识点]:

海量视频数据一键保存
html标签数据解析方法
re解析数据方法

[环境介绍]:

python  3.8
pycharm 2021.2
requests >>> pip install requests
parsel   >>> pip install parsel

+python安装包 安装教程视频
+pycharm 社区版 专业版 及 激活码免费

一. 分析网站(思路分析)

我们通过在网页链接前面+ view-source:https:.....
就可以查看到网页源代码, 我们在网页源代码当中可以找到 视频链接地址

二. 代码实现

1. 发送网络请求
2. 获取数据 网页源代码
3. 筛选数据 视频详情页地址
4. 发送网络请求
5. 获取数据 网页源代码
6. 筛选数据 视频播放地址
7. 访问视频播放地址
8. 获取视频二进制数据
9. 保存 视频数据

导入模块

import requests     # 发送网络请求
import re           # 正则模块
import parsel       # 解析数据模块

看看谁没有安装好模块

1. 发送网络请求

url_1 = 'https://www.520mmtv.com/tag/xg.html'response_1 = requests.get(url_1)

2. 获取数据 网页源代码

data_html_1 = response_1.text

3. 筛选数据 视频详情页地址

selector = parsel.Selector(data_html_1)
info_url_list = selector.css('.meta-title::attr(href)').getall()
title_url_list = selector.css('.meta-title::text').getall()
new_title_list = [i for i in title_url_list if i != ' ']
# zip: 我们需要把视频链接 标题一起进行循环
for zip_data in zip(info_url_list, new_title_list):url = zip_data[0]
    # 1. 发送网络请求response = requests.get(url=url)# <Response [200]>: 发送请求成功响应# 2. 获取数据 网页源代码data_html = response.text# 3. 筛选数据 视频播放地址# 第一个参数匹配规则 第二个我们要在哪里匹配video_url = re.findall('url: "(.*?)",', data_html)[0]print(video_url)# 4. 访问视频播放地址# 5. 获取视频/音频/图片 二进制数据video_data = requests.get(video_url).contenttitle = zip_data[1]# 6. 保存 视频数据with open(f'video\\{title}.mp4', mode='wb') as f:f.write(video_data)print(title, '爬取成功!!!')

好了,我的这篇文章写到这里就结束啦!

有更多建议或问题可以评论区或私信我哦!一起加油努力叭(ง •_•)ง

喜欢就关注一下博主,或点赞收藏评论一下我的文章叭!!!

教你用 Python 看遍女神视界,美女咋越看越精神呢~(内含完整源码)相关推荐

  1. 如何用Python 看遍女神视界?美女咋越看越精神呢~(内含完整源码)

    well ~well ~well ~ 最近精神不是很好,工作总没动力~ 可能是工作太累了, 所以我给自己整了个小东西放松一下~ 有什么python相关报错解答自己不会的.或者源码资料/模块安装/女装大 ...

  2. 【Python】采集3万张4K超清壁纸,实现定时自动更换桌面壁纸脚本(内含完整源码)

    前言 嗨喽!大家好,这里是魔王~ 发现一个不错的壁纸网站,里面都是超高清的图片 所以,我打算把这些壁纸都采集下来,然后在做一个自动跟换桌面壁纸的脚本,这样基本上你一年都可以每天都有不重复桌面了 先来看 ...

  3. java学生考勤系统视频_手把手教你做一个Java 学生信息、选课、签到考勤、成绩管理系统附带完整源码及视频开发教程...

    四个阶段的学生信息系统视频教程终于录制完成了,这里把这四个阶段的系统打个包,如果想一次性全部获取那就点击文章下方的获取按钮,也可以根据下面给出的每个阶段的地址去分别获取,这里简单介绍下四个阶段. 第一 ...

  4. Python:实现hill climbing爬山法用来寻找函数的最大值算法(附完整源码)

    Python:实现hill climbing爬山法用来寻找函数的最大值算法 import mathclass SearchProblem:def __init__(self, x: int, y: i ...

  5. Python:实现一个Pangram字符串至少包含一次所有字母算法(附完整源码)

    Python:实现一个Pangram字符串至少包含一次所有字母算法 def check_pangram(input_str: str = "The quick brown fox jumps ...

  6. 在鹅厂工作的广西表妹教我用Python生成会跳舞的美女~

    导语 我今年31,没有女朋友,身体健康,性取向正常,不抽烟不喝酒不嫖娼,因为孤身一人在外地,技术宅,圈子又小,所以不知不觉单到现在.相亲的都是老家介绍,网上聊着聊着就没有后续了,所以就像一条咸鱼一样p ...

  7. python代码弄成网站_原创:用python把链接指向的网页直接生成图片的http服务及网站(含源码及思想)...

    原创:用python把链接指向的网页直接生成图片的http服务及网站(含源码及思想) 总体思想: 希望让调用方通过 http调用传入一个需要生成图片的网页链接生成一个网页的图片并返回图片链接 最终调用 ...

  8. 原创:用python把链接指向的网页直接生成图片的http服务及网站(含源码及思想)...

    原创:用python把链接指向的网页直接生成图片的http服务及网站(含源码及思想) 总体思想:     希望让调用方通过 http调用传入一个需要生成图片的网页链接生成一个网页的图片并返回图片链接 ...

  9. Python基于OpenCV监控老鼠蟑螂检测系统[完整源码&部署教程]

    1.视频演示: [项目分享]Python基于OpenCV监控老鼠蟑螂检测系统[完整源码&部署教程]_哔哩哔哩_bilibili 2.图片演示: 3.明厨亮灶: 餐饮企业的厨房卫生状况一直饱受消 ...

最新文章

  1. 运动会管理系统php,运动会管理系统源代码.doc
  2. hdu 6386 Age of Moyu (重边判断)
  3. java对象间的转型,详细讲述Java中的对象转型
  4. python计算思维的概念_用Python学计算思维turtle详解
  5. activiti 源码笔记之startProcess
  6. 神器!人工智能分离歌曲中的人声和背景音乐
  7. libpng的使用 | 在Linux系统下编译、安装与使用
  8. 谈谈独立游戏的商业化困境
  9. python 导入自定义包
  10. php 抽奖系统源码下载,魔众砸金蛋抽奖系统PHP源码 v2.0.0
  11. 车间能量看板设计需求,能给个思路吗
  12. 分节符是什么?怎么利用分节符设置某一页文档的页眉页脚?
  13. Windows挂起进程
  14. 支付系统就该这么设计(万能通用)
  15. Excel VBA 002 录制宏
  16. 机器人学习笔记——机器人概述
  17. wind10电脑连接“华为蓝牙耳机”
  18. 【阅读论文】第六章--计算机辅助检测--博-自动化眼底图像分析技术可筛查糖尿病患者的视网膜疾病
  19. Linux下搭建SFTP服务器
  20. 三坐标程序是C语言,三坐标程序编写系统及方法

热门文章

  1. java lambda表达式条件_java_Lambda表达式
  2. -EL 和 -JSTL
  3. 分类指标ROC、AUC
  4. 超级采样 Supersampling 方式汇总
  5. GPT-4来炸场:10秒输出一个网站,识图知意 so easy,为何如此丝滑
  6. 搭建基于Suricata+Barnyard2+Base的IDS前端Snorby
  7. 简单的做一个图片上传预览(web前端)
  8. 什么是sku,sku信息接入方案
  9. 【Layui】数据表格(与后台交互获取数据)
  10. 学习单片机从这里开始