简单的分析一下这个爱拍视频
总结起来 就是及其不安全的一个网站

想获取登录态 很简单到只要设置cookie就ok了 也是很惊讶,然后就是正常爬取流程了。说明一下,建议设置https 然后登录安全要做好。

  • 代码部分:
    首先是获取下载链接
#下载爱拍
import requests
import time
from bs4 import BeautifulSoupAIPAI_SPICE_URL = 'http://home.aipai.com/17899407?action=card&sub=&sort=id&total=844&clicks=5617816&flowers=27350&bookTotal=0&page='
LOGIN_COOKIES = 'cookie部分 这部分需要先登录复制过来即可'
cookies2 = dict(map(lambda x: x.split('='), LOGIN_COOKIES.split(";")))def DownloadTagToTxt(url):res = requests.get(url, cookies=cookies2)bs_html = BeautifulSoup(res.text, 'lxml')h5_list = bs_html.find_all('h5')for h5 in h5_list:a_list = h5.find_all('a')#a_list = bs_html.find_all('h5')for a in a_list:a_str = a.get('href')if a_str.endswith('mp4'):# 打印出a标签print(a_str)if __name__ == '__main__':for num in range(1,72):cur_str = str(num)AIPAI_URL = AIPAI_SPICE_URL+cur_strDownloadTagToTxt(AIPAI_URL)

其次是下载的代码

import os
import time
import requestsdef downloadFile(name, url):''':param name:下载保存的名称:param url: 下载链接:return:'''headers = {'Proxy-Connection': 'keep-alive'}r = requests.get(url, stream=True, headers=headers)length = float(r.headers['content-length'])f = open(name, 'wb')count = 0count_tmp = 0time1 = time.time()for chunk in r.iter_content(chunk_size=512):if chunk:f.write(chunk)count += len(chunk)if time.time() - time1 > 2:p = count / length * 100speed = (count - count_tmp) / 1024 / 1024 / 2count_tmp = countprint(name + ': ' + formatFloat(p) + '%' + ' Speed: ' + formatFloat(speed) + 'M/S')time1 = time.time()f.close()def formatFloat(num):return '{:.2f}'.format(num)if __name__ == '__main__':file_name = 'VideoLink.txt'for line in open(file_name):down_link = line.strip()split_list = down_link.split('/')down_link_name = split_list[len(split_list)-2]+'_'+split_list[len(split_list)-1]downloadFile(down_link_name,down_link)

Python爬虫项目--爱拍视频批量下载相关推荐

  1. python实现网站内部视频批量下载

    一.背景 在有些时候,当我们突然在某个网站看到一个特别好的视频(比如高清MV),想把它下载下来,但突然发现,网站并没有下载链接:这个时候我们一般有几种解决办法: 使用网页插件(比如火狐浏览器的netV ...

  2. 【Python】利用Python爬虫实现网页图片批量下载

    本文爬取的是豆瓣的网站,爬虫有规则,爬虫需谨慎.文章末附效果图 源码下载地址:https://github.com/Seichung/Python/blob/master/Python_Practic ...

  3. python爬虫实战——运用requests批量下载qq音乐

    python -qq音乐爬取 在学习一段时间后,在视频的讲解下,觉得自己掌握的不错,就开始了这一次的qq音乐的爬取,在爬取的过程中发现了很多问题.知识点掌握的不够,知识点掌握的不熟,例如:正则表达式的 ...

  4. Python爬虫案例教学:批量下载某狗所有热门榜单歌曲(附完整源码)

    环境 Python 3.6 Pycharm 模块使用 import os import requests import parsel import re # 模块安装 ''' 如何安装模块: 1. w ...

  5. python网上批量下载表格_python爬虫智能翻页批量下载文件的实例详解

    python爬虫遇到爬取文件内容时,需要一页页的翻页爬取,这样很是麻烦,其实可以获取每个列表信息下的文件名和文件链接,让文件名和文件链接处理为列表,保存后下载,实现智能翻页批量下载文件,本文以以京客隆 ...

  6. 爬虫进阶教程:抖音APP无水印视频批量下载

    一.前言 本文为两类人准备:技术控和工具控. 如果你是工具控,想简单方便地下载无水印的视频,那么可以使用第三方去水印平台: 抖音短视频解析下载平台 如果你是技术控,想要使用自己写的代码下载视频,那么可 ...

  7. python爬虫项目实战教学视频_('[Python爬虫]---Python爬虫进阶项目实战视频',)

    爬虫]---Python 爬虫进阶项目实战 1- Python3+Pip环境配置 2- MongoDB环境配置 3- Redis环境配置 4- 4-MySQL的安装 5- 5-Python多版本共存配 ...

  8. python爬虫项目-33个Python爬虫项目实战(推荐)

    今天为大家整理了32个Python爬虫项目. 整理的原因是,爬虫入门简单快速,也非常适合新入门的小伙伴培养信心.所有链接指向GitHub,祝大家玩的愉快~O(∩_∩)O WechatSogou [1] ...

  9. 32个Python爬虫项目

    今天为大家整理了32个Python爬虫项目. 整理的原因是,爬虫入门简单快速,也非常适合新入门的小伙伴培养信心.所有链接指向GitHub,祝大家玩的愉快~O(∩_∩)O WechatSogou [1] ...

最新文章

  1. web 前端绘制折线_前端每日实战:苦练 CSS 基本功——图解辅助线的原理和画法...
  2. UNIX再学习 -- shell编程
  3. 肝!分享 2 本高质量算法书籍!
  4. python双下划线什么意思_python中几个双下划线用法的含义
  5. c/c++ 编程试题
  6. 从Jupyter Notebook切换到脚本的5个理由
  7. java 不允许默认构造_java – 如何使用ObjectMapper去除/序列化不可变对象而不使用默认构造函数?...
  8. elasticsearch 主键字段_ElasticSearch 索引 VS MySQL 索引
  9. 自然语言处理(NLP)与自然语言理解(NLU)的区别
  10. 用c 语言的英文标识 阶乘,求10000的阶乘(c语言代码实现)
  11. fullcalendar 课程表 js 插件 日程安排操作 js
  12. SpringBoot四大核心
  13. zeppelin源码分析(1)——编译、调试和maven modules分析
  14. MFC如何添加系统菜单(菜单添加小图标)
  15. 数控是用计算机来计算的吗,数控机床的完美控制—帮助页面和计算器
  16. 如何拥有一个AI模特?AI绘画换脸换装教程
  17. 计算机关闭后桌面文件丢失,电脑自动关机后桌面文件丢失怎么恢复
  18. 读取的GPS数据为乱码
  19. 怎么解决长期戴口罩脸过敏的肌肤问题
  20. java bo对象_Java 中 DO、PO、BO、DTO、VO 等各对象概念说明

热门文章

  1. MySQL误删数据?快速恢复指南来了!
  2. BigDecimal你遇见过哪些坑?
  3. Java并发之ThreadLocal
  4. 面试必会之LinkedList源码分析
  5. springboot使用spring-data-jpa操作MySQL数据库
  6. VCL组件之编辑控件
  7. java中junit用法,JUnit基本用法
  8. 【转贴】龙芯内核发展策略 已经支持k8s
  9. python接口自动化(三十二)--Python发送邮件(常见四种邮件内容)番外篇——上(详解)...
  10. codevs1700 施工方案第二季