1.缘由

前几天参加一个活动,需要制作ppt,制作完之后ppt模板死活不能让人满意。然后就去网上找模板,有些比较适合ppt模板还是收费的,这…,有点恶心,哈哈哈!!

今天教大家如何使用python爬虫爬取1万份『ppt模板』,以后制作ppt再也不怕了没有模板了!!!

2.相关介绍

网站:

https://sc.chinaz.com/ppt/free.html


一共702页,每页20个ppt模板

2.爬虫思路

先遍历每一页,获取每一页ppt模板的url。
根据ppt模板的url获取下载地址。
最后根据下载地址将文件下载到本地。

3.遍历每一页

获取ppt模板url和类型

# 个人公众号 yk 坤帝
# 后台回复 ppt模板 领取ppt
for i in range(15):response = requests.get('https://sc.chinaz.com/ppt/free_' + str(i)  + '.html')response.encoding = 'utf-8'page_text = response.texttree = etree.HTML(page_text)div_list = tree.xpath('//div[@class="bot-div"]')for div in div_list:href ='https://sc.chinaz.com' + div.xpath('./a/@href')[0]title = div.xpath('./a/text()')[0]

保存ppt的url和类型

4.下载保存

获取下载地址:

# 个人公众号 yk 坤帝
# 后台回复 ppt模板 领取ppt
res = requests.get(href)
tree = etree.HTML(res.text)url = tree.xpath('//div[@class="download-url"]/a[1]/@href')[0]
print(url)
ppt = requests.get(href).contentif not os.path.exists('ppt模板'):os.mkdir('ppt模板')with open('ppt模板/' + title + '.rar', 'wb') as file:file.write(ppt)
print(title + ':下载完毕!!!!!!')


5.批量下载

for i in range(15):response = requests.get('https://sc.chinaz.com/ppt/free_' + str(i)  + '.html')

通过设置遍历的页数,实现批量下载

6.10000+ppt模板素材随用随取

通过python编程实现爬取10000+ppt模板素材,以后再也不用担心制作ppt没有模板了!

10000+ppt模板下载

10000+ppt免费下载领取(python爬取全站ppt)相关推荐

  1. 在当当买了python怎么下载源代码-Python爬取当当、京东、亚马逊图书信息代码实例...

    注:1.本程序采用MSSQLserver数据库存储,请运行程序前手动修改程序开头处的数据库链接信息 2.需要bs4.requests.pymssql库支持 3.支持多线程 from bs4 impor ...

  2. 在当当买了python怎么下载源代码-Python爬取当当网最受欢迎的 500 本书

    想看好书?想知道哪些书比较多人推荐,最好的方式就是看数据,接下来用 Python 爬取当当网五星图书榜 TOP500 的书籍,或许能给我们参考参考! Python爬取目标 爬取当当网前500本受欢迎的 ...

  3. 在当当买了python怎么下载源代码-Python爬取当当网APP数据

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理 以下文章来源于AirPython ,作者星安果 目标 场景:有时候通过传统的方法去 ...

  4. 使用Python爬取各类ppt模板素材————

    基于Python好用的爬虫程序,亲测! python代码实现[完整] 若由于一些原因,通过程序无法获取ppt模板素材的,可以从以下链接中直接下载获取部分行业的ppt模板文件.如果未能找到符合所需要的p ...

  5. python爬取电影评分_用Python爬取猫眼上的top100评分电影

    代码如下: # 注意encoding = 'utf-8'和ensure_ascii = False,不写的话不能输出汉字 import requests from requests.exception ...

  6. python爬取猫眼电影数据

    每天一点点,记录学习每一步 近期爬虫项目: 1:python 爬取菜鸟教程python100题,百度贴吧图片反爬虫下载,批量下载 2:python爬虫爬取百度贴吧图片,requests方法 3:pyt ...

  7. Python爬取豆瓣+数据可视化

    博客原文和源码下载:Python爬取豆瓣+数据可视化 前言 前段时间应我姐邀请,看了一下Python爬虫.不得不说Python的语法确实简洁优美,可读性强,比较接近自然语言,非常适合编程的初学者上手. ...

  8. python 24位图转 8位_Python爬取PPT模板小工具下载-Python爬取PPT模板小工具免费版下载v1.0...

    由于很多PPT抓取工具都会因为版本问题无法使用,所以论坛大神就自己写了这款Python爬取PPT模板小工具,可以帮助用户轻松获取各种PPT模板,使用的时候注意一次只能下载一种类型.软件仅供交流学习,下 ...

  9. python爬取QQ音乐免费歌曲 2020.7.26

    python爬取qq音乐免费歌曲 2020.7.26 目标分析 获取音乐列表 1.浏览器网络请求追踪 2.寻找音乐列表 解析qq音乐 1.下载连接组成 2.获取vkey 3.获取sign参数 关系图 ...

最新文章

  1. 【组队学习】孙健坤:基于Python的会员数据化运营
  2. DSP学习 -- 软件开机自启动
  3. Nginx FastCGI的运行原理
  4. Eclipse 常用快捷键-java
  5. WPF 记一个Popup踩坑记录
  6. 门禁系统产品选择与施工要点
  7. 马云宣布再捐赠800台呼吸机 用最快的速度送到欧洲国家一线医院
  8. 创意美食海报psd分层模板,开启奇思妙想
  9. python如何写各种小工具_python写了个小工具
  10. dup_val_on_index_oracle学习笔记(十六) PL/SQL 异常和goto语句
  11. hand keypoint detection in single images using multiview bootstrapping
  12. android dmp文件解析,用minidump_stackwalk分析dmp文件失败
  13. 18650锂电池保护板接线图_锂电池保护板几种接线方法介绍
  14. 异常:could not initialize proxy - the owning Session
  15. 大数据-玩转数据-阿里云获取AccessKey步骤
  16. Learning Standard C++ as a New Language ( By Bjarne Stroustrup )
  17. 淘宝心选在大润发开店了,背后意味着什么?
  18. 考研部分概念和流程(若不全和错误可提示我补充,另考研帮app推荐)
  19. Windows组策略管理
  20. 关于《做最好的中层》的体会与感悟

热门文章

  1. 179个CAD三维快捷键命令,帮CAD初学者迅速提升制图效率
  2. Other_ali_machine_learning
  3. 威创可视化大屏、恒泰实达集成电子使用总结
  4. 如何提取公众号文章封面图
  5. BEPs协议:BUMO ATP 20 协议
  6. 【Blender】摄像机-动画
  7. ROS学习笔记(1)6轴机器臂的URDF文件的生成并用rviz和moveit显示
  8. 2022年湖北省自然科学基金计划项目申请条件、要求和项目类型
  9. ITSS三级认证有哪些申请条件?
  10. 这个0成本必赚套利方法,值得你学习!