python一键批量下载个人简历网的简历模板
网址:http://www.gerenjianli.com/moban/index.html
需求
小王和他的同们要毕业了,想要一些好看有免费的简历模板,于是找了这个网站,他想下载这个网站的全部简历模板。
分析
网站结构较简单,只需要点击简历图片跳转进入详情页界面即可看到下载按钮,点击下载按钮即可下载简历模板,第一步只需要在首页中找到详情页的url,然后模拟浏览器对详情页的url发起请求,然后找到下载按钮对应的url地址,对这个地址发起请求即可。
本文采用xpath解析方式来获取详情页url和下载按钮的url,注意查看页面编码。
代码
import requests
from lxml import etree
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) ''Chrome/91.0.4472.114 Safari/537.36 '}
for pagenum in range(1,3): #此处可更改范围,此处下载1~2页为例if pagenum ==1:url = 'http://www.gerenjianli.com/moban/index.html'else:url = 'http://www.gerenjianli.com/moban/index_'+ str(pagenum) +'.html'page_text = requests.get(url=url, headers=headers)page_text.encoding= 'gb2312' #设置编码格式page_text=page_text.text# print(page_text)tree = etree.HTML(page_text) #实例化一个etree对象,将首页源码加载到该对象中。li_list = tree.xpath('//div[@class="list_boby"]/ul[@class="prlist"]/li') #找到简历模板对应的li标签for li in li_list: #循环遍历所有的li标签,定位到简历对应的名字和简历详情页的urlresume_name = li.xpath('./div/a/img/@alt')[0]resume_src = li.xpath('./div/a/@href')[0]download_text=requests.get(url=resume_src,headers=headers).textdtree = etree.HTML(download_text) #实例化一个etree对象,将详情页的源码加载到该对象中。dsrc = dtree.xpath('//div[@class="donwurl2"]/a/@href')[0] #定位到下载按钮对应的urlresult = requests.get(url=dsrc,headers=headers).content #发起请求download_path = 'D:\\文件\\简历\\' + resume_name + '.docx' #存储到本地with open(download_path,'wb') as fp:fp.write(result)print(resume_name+'下载成功!')
结果
python一键批量下载个人简历网的简历模板相关推荐
- python批量下载模库网图片
这里写自定义目录标题 python批量下载模库网图片 步骤: 代码 python批量下载模库网图片 步骤: 获取页数 获取列表页 获取图片链接和名字相关字典 创建存放图片的文件夹 下载图片 代码 im ...
- python读取哨兵卫星数据_科学网—【Python】批量下载Sentinel-2卫星数据 - 江佳乐的博文...
简介:本文介绍了一种基于Python批量下载Sentinel-2卫星数据的方法.通过该方法,用户可自定义感兴趣研究区(ROI).限定时间范围.选择产品类别.进行云量筛选,实现自动化批量下载Sentin ...
- python爬虫批量下载“简谱”
python讨论qq群:996113038 导语: 上次发过一篇关于"python打造电子琴"的文章,从阅读量来看,我们公众号的粉丝里面还是有很多对音乐感兴趣的朋友的.于是,今天我 ...
- python怎么批量下载年报_Python+Wind 批量下载上市公司年报 - Part 1/2
Python+Wind 批量下载上市公司年报 - Part 1/2作者:张捷 目录1.背景介绍 2.安装Python 3.爬取万得上市公司年报3.1Wind下载公告信息 3.2获得年报地址 4.使用P ...
- 如何使用python批量下载-使用 Python + Selenium 批量下载素材
原文首发于CSDN,略有增删 使用 Python + Selenium 批量下载素材 本文简单介绍使用 Python + Selenium 从ManyPixels线上图库批量下载素材的方法.截止到现在 ...
- python批量下载文件-Python实现批量下载文件
Python实现批量下载文件 #!/usr/bin/env python # -*- coding:utf-8 -*- from gevent import monkey monkey.patch_a ...
- python批量下载网页文件-Python实现批量下载文件
Python实现批量下载文件 #!/usr/bin/env python # -*- coding:utf-8 -*- from gevent import monkey monkey.patch_a ...
- python 下载文件-Python实现批量下载文件
Python实现批量下载文件 #!/usr/bin/env python # -*- coding:utf-8 -*- from gevent import monkey monkey.patch_a ...
- python之批量下载网页数据
python之批量下载网页数据 要下载如下网页所示数据,一个一个点下载繁琐,我们用python代码来批量下载. python代码: import urllib.request # url reques ...
- 新一配:perl循环调用python爬虫批量下载喜马拉雅音频
新一配:perl循环调用python爬虫批量下载喜马拉雅音频 手机下载喜马拉雅音频后,获得的音频文件虽然可以转成mp3格式,但其文件名却是一长串字符串,无法辨别是哪一集,网上找了各种工具,都有局限性, ...
最新文章
- 开源 多进程 框架 c++_linux fork多进程并发服务器模型之C/C++代码实战
- centos 安装低版本内核_Docker安装教程
- Spring Boot集成Swagger
- Pentium 4处理器架构/微架构/流水线 (4) - NetBurst框图
- 目录访问共享C#怎么访问共享目录
- Web测试和App测试区别
- linux centos 网易云音乐,Centos7.4安装网易云音乐教程
- 进制之间的转换(史上最全自己纯手工总结)
- Java小游戏实操---大鱼吃小鱼 游戏开发
- AcWing蓝桥杯AB组辅导课10、疑难杂题
- 电脑同时开有线和无线,优先使用哪个?
- js折线图设置y轴刻度_d3.js实现自定义多y轴折线图
- 2023面试官常考的前端面试题
- 使用注解失败的原因及解决方法
- 业务逻辑漏洞挖掘-某网站绕过下载付费机制进行下载文件
- 剑网三服务器一直未响应,《剑网3》大师赛第二个比赛日赛后采访回顾
- 电话资源导入微信/QQ通讯录操作方法
- Docker快速入门总结笔记
- 【Transformer】一文搞懂Transformer | CV领域中Transformer应用
- IOS字体设置及展现效果
热门文章
- java中画幅相机推荐_中画幅的初级入门选择-飞思645DF+
- Linux下载Mysql
- 环绕声混响效果器-Acon Digital Verberate Immersive 2.2.1 WiN-MAC
- 利用Proteus软件设计红绿灯(数字电路与逻辑设计)
- 记一次优化天猫商城系统高并发的经验
- win7电脑如何安装柯尼卡美能达C364e打印驱动
- 大厂面试必问!疯狂Java讲义第五版pdf在线阅读
- linux硬盘修复软件,DiskGenius下载-硬盘修复软件(DiskGenius)官方版下载[电脑版]-PC下载网...
- 在linux上下载图片,在Linux上使用4k Stogram下载Instagram图片库 | MOS86
- 汽车故障码(P C B U)格式解析