网址:http://www.gerenjianli.com/moban/index.html

需求

小王和他的同们要毕业了,想要一些好看有免费的简历模板,于是找了这个网站,他想下载这个网站的全部简历模板。

分析

网站结构较简单,只需要点击简历图片跳转进入详情页界面即可看到下载按钮,点击下载按钮即可下载简历模板,第一步只需要在首页中找到详情页的url,然后模拟浏览器对详情页的url发起请求,然后找到下载按钮对应的url地址,对这个地址发起请求即可。

本文采用xpath解析方式来获取详情页url和下载按钮的url,注意查看页面编码。

代码

import requests
from lxml import etree
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) ''Chrome/91.0.4472.114 Safari/537.36 '}
for pagenum in range(1,3): #此处可更改范围,此处下载1~2页为例if pagenum ==1:url = 'http://www.gerenjianli.com/moban/index.html'else:url = 'http://www.gerenjianli.com/moban/index_'+ str(pagenum) +'.html'page_text = requests.get(url=url, headers=headers)page_text.encoding= 'gb2312' #设置编码格式page_text=page_text.text# print(page_text)tree = etree.HTML(page_text)  #实例化一个etree对象,将首页源码加载到该对象中。li_list = tree.xpath('//div[@class="list_boby"]/ul[@class="prlist"]/li') #找到简历模板对应的li标签for li in li_list: #循环遍历所有的li标签,定位到简历对应的名字和简历详情页的urlresume_name = li.xpath('./div/a/img/@alt')[0]resume_src = li.xpath('./div/a/@href')[0]download_text=requests.get(url=resume_src,headers=headers).textdtree = etree.HTML(download_text) #实例化一个etree对象,将详情页的源码加载到该对象中。dsrc = dtree.xpath('//div[@class="donwurl2"]/a/@href')[0] #定位到下载按钮对应的urlresult = requests.get(url=dsrc,headers=headers).content #发起请求download_path = 'D:\\文件\\简历\\' + resume_name + '.docx' #存储到本地with open(download_path,'wb') as fp:fp.write(result)print(resume_name+'下载成功!')

结果

python一键批量下载个人简历网的简历模板相关推荐

  1. python批量下载模库网图片

    这里写自定义目录标题 python批量下载模库网图片 步骤: 代码 python批量下载模库网图片 步骤: 获取页数 获取列表页 获取图片链接和名字相关字典 创建存放图片的文件夹 下载图片 代码 im ...

  2. python读取哨兵卫星数据_科学网—【Python】批量下载Sentinel-2卫星数据 - 江佳乐的博文...

    简介:本文介绍了一种基于Python批量下载Sentinel-2卫星数据的方法.通过该方法,用户可自定义感兴趣研究区(ROI).限定时间范围.选择产品类别.进行云量筛选,实现自动化批量下载Sentin ...

  3. python爬虫批量下载“简谱”

    python讨论qq群:996113038 导语: 上次发过一篇关于"python打造电子琴"的文章,从阅读量来看,我们公众号的粉丝里面还是有很多对音乐感兴趣的朋友的.于是,今天我 ...

  4. python怎么批量下载年报_Python+Wind 批量下载上市公司年报 - Part 1/2

    Python+Wind 批量下载上市公司年报 - Part 1/2作者:张捷 目录1.背景介绍 2.安装Python 3.爬取万得上市公司年报3.1Wind下载公告信息 3.2获得年报地址 4.使用P ...

  5. 如何使用python批量下载-使用 Python + Selenium 批量下载素材

    原文首发于CSDN,略有增删 使用 Python + Selenium 批量下载素材 本文简单介绍使用 Python + Selenium 从ManyPixels线上图库批量下载素材的方法.截止到现在 ...

  6. python批量下载文件-Python实现批量下载文件

    Python实现批量下载文件 #!/usr/bin/env python # -*- coding:utf-8 -*- from gevent import monkey monkey.patch_a ...

  7. python批量下载网页文件-Python实现批量下载文件

    Python实现批量下载文件 #!/usr/bin/env python # -*- coding:utf-8 -*- from gevent import monkey monkey.patch_a ...

  8. python 下载文件-Python实现批量下载文件

    Python实现批量下载文件 #!/usr/bin/env python # -*- coding:utf-8 -*- from gevent import monkey monkey.patch_a ...

  9. python之批量下载网页数据

    python之批量下载网页数据 要下载如下网页所示数据,一个一个点下载繁琐,我们用python代码来批量下载. python代码: import urllib.request # url reques ...

  10. 新一配:perl循环调用python爬虫批量下载喜马拉雅音频

    新一配:perl循环调用python爬虫批量下载喜马拉雅音频 手机下载喜马拉雅音频后,获得的音频文件虽然可以转成mp3格式,但其文件名却是一长串字符串,无法辨别是哪一集,网上找了各种工具,都有局限性, ...

最新文章

  1. 开源 多进程 框架 c++_linux fork多进程并发服务器模型之C/C++代码实战
  2. centos 安装低版本内核_Docker安装教程
  3. Spring Boot集成Swagger
  4. Pentium 4处理器架构/微架构/流水线 (4) - NetBurst框图
  5. 目录访问共享C#怎么访问共享目录
  6. Web测试和App测试区别
  7. linux centos 网易云音乐,Centos7.4安装网易云音乐教程
  8. 进制之间的转换(史上最全自己纯手工总结)
  9. Java小游戏实操---大鱼吃小鱼 游戏开发
  10. AcWing蓝桥杯AB组辅导课10、疑难杂题
  11. 电脑同时开有线和无线,优先使用哪个?
  12. js折线图设置y轴刻度_d3.js实现自定义多y轴折线图
  13. 2023面试官常考的前端面试题
  14. 使用注解失败的原因及解决方法
  15. 业务逻辑漏洞挖掘-某网站绕过下载付费机制进行下载文件
  16. 剑网三服务器一直未响应,《剑网3》大师赛第二个比赛日赛后采访回顾
  17. 电话资源导入微信/QQ通讯录操作方法
  18. Docker快速入门总结笔记
  19. 【Transformer】一文搞懂Transformer | CV领域中Transformer应用
  20. IOS字体设置及展现效果

热门文章

  1. java中画幅相机推荐_中画幅的初级入门选择-飞思645DF+
  2. Linux下载Mysql
  3. 环绕声混响效果器-Acon Digital Verberate Immersive 2.2.1 WiN-MAC
  4. 利用Proteus软件设计红绿灯(数字电路与逻辑设计)
  5. 记一次优化天猫商城系统高并发的经验
  6. win7电脑如何安装柯尼卡美能达C364e打印驱动
  7. 大厂面试必问!疯狂Java讲义第五版pdf在线阅读
  8. linux硬盘修复软件,DiskGenius下载-硬盘修复软件(DiskGenius)官方版下载[电脑版]-PC下载网...
  9. 在linux上下载图片,在Linux上使用4k Stogram下载Instagram图片库 | MOS86
  10. 汽车故障码(P C B U)格式解析