源码:

import requests
import os
from lxml import etreeif not os.path.exists('./简历模板'):os.mkdir('./简历模板')headers={'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.71 Safari/537.36'
}
#1.输入url,获取网页数据
url='https://aspx.sc.chinaz.com/query.aspx?keyword=%E5%85%8D%E8%B4%B9&classID=864'
page_text=requests.get(url=url,headers=headers).text#2.实例化etree对象,获取的源码数据加载到该对象中
tree=etree.HTML(page_text)#属性定位,数据解析
li_list=tree.xpath('//div[@class="sc_warp  mt20"]/div/div/div')#获取属性值@href、@alt
for li in li_list:target_url='https:'+li.xpath('./a/@href')[0]target_name=li.xpath('./a/img/@alt')[0]+'.rar'#3.拿到各个网页的url,获取各个网页的数据resume_data=requests.get(url=target_url,headers=headers).text#实例网页数据对象resume_tree=etree.HTML(resume_data)#属性定位,数据解析resume_download=resume_tree.xpath('//div[@class="down_wrap"]/div[2]/ul/li[3]')#4、获取属性值-每个简历对应的下载地址for download in resume_download:download_url=download.xpath('./a/@href')[0]resume_rar_page=requests.get(url=download_url,headers=headers).contenttarget_Path='./简历模板/'+target_namewith open(target_Path,'wb') as fp:fp.write(resume_rar_page)print(target_name+'成功!!!')# pass

运行效果:

Python—爬取简历模板案例(Xpath方法)相关推荐

  1. python爬取简历模板_python 爬取免费简历模板网站的示例

    代码 # 免费的简历模板进行爬取本地保存 # http://sc.chinaz.com/jianli/free.html # http://sc.chinaz.com/jianli/free_2.ht ...

  2. 爬虫:python爬取简历模板

    import requests from lxml import etree import os # 分页: if __name__ == "__main__":if not os ...

  3. python爬取欧美美女图片---xpath方法

    这里爬取的是http://sc.chinaz.com/tag_tupian/OuMeiMeiNv.html网站 献上欧美美女!!!! from lxml import etree import url ...

  4. python 24位图转 8位_Python爬取PPT模板小工具下载-Python爬取PPT模板小工具免费版下载v1.0...

    由于很多PPT抓取工具都会因为版本问题无法使用,所以论坛大神就自己写了这款Python爬取PPT模板小工具,可以帮助用户轻松获取各种PPT模板,使用的时候注意一次只能下载一种类型.软件仅供交流学习,下 ...

  5. Python爬取PPT模板(requests+BeautifulSoup+多线程)

    Python爬取PPT模板(requests+BeautifulSoup+多线程) 快到做毕业设计的时间了,得去找点好看的PPT模板了,在http://www.ypppt.com这个网站上发现了很多不 ...

  6. Python批量爬取简历模板

    文章目录 前言 一.需求 二.分析 1. 查看网页源码(ctrl+u) 2.进一步分析 三.处理 四.运行效果 前言 为了更好的掌握数据处理的能力,因而开启Python网络爬虫系列小项目文章. 小项目 ...

  7. Python爬取基金数据案例

    爬取基金数据案例 爬虫常规思路: 1.分析网页 2.对网页发送请求,获取响应 3.提取解析数据 4.保存数据 本案例所用到的模块: import requests import time import ...

  8. python爬虫 爬取简历模板

    简介:爬取"个人简历网"中的简历模板并存储到本地(http://www.gerenjianli.com/moban/index.html) 代码: import requests ...

  9. python爬取app图片_利用python爬取斗鱼app中照片方法实例

    前言 没想到python是如此强大,令人着迷,以前看见图片总是一张一张复制粘贴,现在好了,学会python就可以用程序将一张张图片,保存下来. 最近看到斗鱼里的照片都不错,决定用最新学习的python ...

最新文章

  1. MATLAB可以打开gms文件吗,GMS文件扩展名 - 什么是.gms以及如何打开? - ReviverSoft...
  2. 腾讯会议又一黑科技,屏蔽超过 200 种会议噪声是如何做到的?
  3. bigdecimal正确用法_BigDecimal用法详解
  4. android 5 sdk版本下载地址,android5 sdk 下载地址大全
  5. 用shell脚本实现MongoDB数据库自动备份
  6. java中文乱码 寮犱笁_MySQL命令窗口中文乱码或插入中文数据失败
  7. netflow报文格式与数据处理流程分析_RTK、三维激光扫描、无人机倾斜摄影在大比例尺地形图测绘的对比分析...
  8. ruby 类方法与实例方法_Ruby Set相交? 实例方法
  9. virtual box中安装Mac OS后设置分辨率
  10. mysql 按小时统计
  11. linux fread函数的用法,fread和fwrite用法详解
  12. Daemontools和Supervisor管理linux常驻进程
  13. mac 设置maven环境变量并永久生效
  14. html下拉菜单hover,css用hover制作下拉菜单
  15. python实训日志_最新Python实训周总结
  16. <视觉SLAM十四讲> 李群与李代数
  17. 7-28 | 猴子选大王
  18. c++总结(updating)
  19. (附源码)计算机毕业设计SSM疫情下小区网格化管理系统
  20. strchr、strstr函数

热门文章

  1. php数据库模糊查询
  2. Access2007 操作或事件已被禁用模式阻止解决办法
  3. gp服务发布服务的地图,web客户端显示的位置跟arcgis中显示的位置不一致,不相符(我的是等值面发布的gp服务)
  4. vue.js的JSON数据解析
  5. inode和软硬链接
  6. HM解码(一) :提取一个NALU信息
  7. 从阻塞式IO到epoll——IO精讲
  8. android gpu 2d加速,强制使用GPU加速 对Android设备加速画面显示有效吗
  9. 记录appimage
  10. 《珍藏TC2.0》: TCC.exe,TLink.exe,TLib.exe 命令行选项及其使用!