Python-ppt模板批量下载
- 基于Python 爬虫批量下载ppt模板
- github
- https://www.cnblogs.com/w0000/p/15106500.html
import requests
from lxml import etree
import time
import os
def creatPath(path):if not os.path.exists(path):print("Creat path")os.makedirs(path)if __name__ == '__main__':headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.107 Safari/537.36"}path = 'D:/ppt_download/'creatPath(path)page_num_max = 5for page_num in range(page_num_max):base_url ='https://www.ypppt.com/moban/list-{0}.html'.format(page_num)#base_url = 'https://www.ypppt.com/moban/new/index_1.html'base_text = requests.get(url=base_url,headers=headers).text#print(base_text)base_tree = etree.HTML(base_text)#主页面详情页列表detail_li_list = base_tree.xpath('//ul[@class="posts clear"]/li')for li in detail_li_list:time.sleep(0.1)#详情页链接detail_url = 'https://www.ypppt.com/' + li.xpath('./a[2]/@href')[0]detail_page = requests.get(url=detail_url,headers=headers).textdetail_tree = etree.HTML(detail_page)inf_data = detail_tree.xpath('//div[@class="infoss"]')[0]#ppt标题title = inf_data.xpath('./h1/text()')[0].encode('iso-8859-1').decode('utf-8')#跳转链接dowmload_page_url = 'https://www.ypppt.com/' + inf_data.xpath('./div[@class="button"]/a/@href')[0]#print(dowmload_page_url)dowmload_page = requests.get(url=dowmload_page_url,headers=headers).textdowmload_tree = etree.HTML(dowmload_page)#zip下载链接dowmload_url = dowmload_tree.xpath('//ul[@class="down clear"]/li/a/@href')[0]#二进制流ppt_data = requests.get(url=dowmload_url).contentfp = open(path+title + '.zip','wb')fp.write(ppt_data)print(title)
Python-ppt模板批量下载相关推荐
- 极品PPT模板批量下载:一天成为 PPT达人
极品PPT模板批量下载:一天成为 PPT达人 <说服力:让你的PPT会说话>对读者做过问卷,最终反馈有88.8%的读者认为"PPT对职场晋升有很大帮助".在职场上行走江 ...
- ❤️再也不用担心PPT模板下载问题,python爬虫 PPT模板批量下载❤️
最近工作中要使用PPT,但是模板搞不定怎么办,嘿嘿,直接批量下载,各种模板随便安排. 找了很多PPT模板网站,发现大多数网站都要登陆和vip才可以下载到想要的模板.后来发现这个网站不需要登陆和vip也 ...
- 超强神器,海量PPT模板一键下载工具,亲测可用!
一款实用Python开发的爬虫工具,海量PPT模板免费下载. 下载的PPT在你软件运行的盘符的根目录中的newnew文件夹里,可以多开,建议不要开太多. 此软件已经使用了两年,使用感觉对于有需要的时候 ...
- python爬虫实现批量下载百度图片
今天和小伙伴们合作一个小项目,需要用到景点图片作为数据源,在百度上搜索了一些图片,感觉一个一个手动保存太过麻烦,于是想到用爬虫来下载图片. 本次代码用到了下列一些python模块,需要预先安装Beau ...
- 0004-环保公益环保宣传PPT模板免费下载
0004-环保公益环保宣传PPT模板免费下载 下载地址
- 利用Python编写脚本批量下载公众号中的音频
欢迎大家光临我的博客,大家一起交流学习哦 陈京九的博客 首先声明我只是一个小菜鸡,把自己琢磨一些功能的过程发到了这里当做记录,希望大神们轻喷,能给我一些指导就更好啦~ 上一篇博客教大家下载了公众号中的 ...
- python上市公司_Python批量下载上交所上市公司报告
上交所的上市公司报告搜索页面http://www.sse.com.cn/disclosure/listedinfo/announcement/ 通过查看页面调用的接口可以发现: 获取上交所全部股票代码 ...
- Python实现壁纸批量下载
Python实现壁纸批量下载 最近想要一些新的壁纸,但是从网站上面找一张一张下载太慢了,所以写了个爬虫批量下载壁纸. 先看看实现的效果 需要的包: requests.bs4 .os.re 源码: # ...
- 0001-环保局垃圾分类绿色低碳通用PPT模板免费下载
0001-环保局垃圾分类绿色低碳通用PPT模板免费下载 https://baippt.ctfile.com/fs/5288276-344008915
- 0003-动态环境绿色公益环保宣传PPT模板免费下载
0003-动态环境绿色公益环保宣传PPT模板免费下载 https://baippt.ctfile.com/fs/5288276-344008927
最新文章
- 补第一阶段冲刺站立会议3(应发表日期5月15日)
- doctype的种类
- 【Python】爬虫学习
- SpringBoot+Vue+Redis实现前后端分离的字典缓存机制
- java如何忽略过程值_如果值为null,如何告诉Jackson在序列化期间忽略某个字段?...
- Linux 查看目录常用命令
- B系列台达服务器解密码步骤,台达HMI解密,DOP-A解密,DOP-B解密,文件密码解密
- shell替换程序里的代码
- Git使用中报错fatal: The current branch master has no upstream branch.解决方案
- Let's go home
- spring源码 学习方法
- 微信小程序简单论坛实现demo,供参考。
- 工训物流小车视觉开源代码,包含二维码、条形码、物块、标识靶识别
- mac版docker配置加速
- CF 86D 莫队(卡常数)
- 《图书管理系统》-用例图、活动图与时序图简单绘制-startUML
- java项目 无法重命名_重命名项不起作用
- 通过WPF自定义ListBox控件实现ListBoxItem中开关及删除功能
- aardio - 【库】sunny网络中间件
- 图像分类CNN经典网络(一)AlexNet与VGG
热门文章
- 猎豹移动Q3季报图解:游戏营收近3亿 成增长亮点
- 无盘服务器读写盘设置,无盘服务器读写盘设置
- 开发者视角论述HTML5平台的7大特点
- [RK3288][Android6.0] 调试笔记 --- 双屏显示内核Patch
- 大学生玩计算机游戏的现状,大学生网络游戏的现状分析
- 【零基础学STM32】CubeMX+HAL玩转电机控制
- 硬盘加密:如何给移动硬盘加密
- 汽车称重软件的秤台和车辆管理有哪些要求(二)
- python 爬取东方财富股吧论坛个股评论信息
- 【第108期】技术大牛都在看的10本书,找到了