import requests
import os
import re
from lxml import etree# 判断简历文件夹是否存在,不存在创建
if not os.path.exists("./简历"):os.mkdir("./简历")for z in range(1, 3):if z == 1:# 第一页url地址url = "https://sc.chinaz.com/jianli/free.html"else:# 第二页url地址url = f"https://sc.chinaz.com/jianli/free_{z}.html"# 请求头headers = {"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36 Edg/110.0.1587.69"}page_text = requests.get(url=url, headers=headers)# 避免请求数据为乱码page_text.encoding = "utf-8"result = page_text.text# 将源码数据加载到etree对象中tree = etree.HTML(result)# 解析源码url_list = tree.xpath("//div[@class='box col3 ws_block']/p")for i in url_list:# 每个简历模板的url地址resume_url = i.xpath("./a/@href")[0]# 每个简历模板的名称resumeName = i.xpath("./a/text()")[0]# 加载简历模板页面page_text_2 = requests.get(url=resume_url, headers=headers)# 处理乱码page_text_2.encoding = "utf-8"page_a = page_text_2.text# 正则匹配下载连接ree = """<li><a href='(.*?)' target="_blank">福建电信下载</a></li>"""# 匹配到第一页所有的简历模板直接下载的urldownload_url = re.findall(ree, page_a)# 下载二进制数据到缓存expect = requests.get(url=download_url[0], headers=headers).content# 创建单个简历模板文件with open("./简历/" + resumeName + ".rar", "wb") as fp:# 写入数据fp.write(expect)print(resumeName + "下载完成!!!")

使用python批量下载免费简历模板相关推荐

  1. Python批量爬取简历模板

    文章目录 前言 一.需求 二.分析 1. 查看网页源码(ctrl+u) 2.进一步分析 三.处理 四.运行效果 前言 为了更好的掌握数据处理的能力,因而开启Python网络爬虫系列小项目文章. 小项目 ...

  2. 批量下载免费PPT模板【另一种智能翻页】

    1.导入模块并判断所下载类型PPT是否存在文件夹,若无,新建 import requests import os from lxml import etree path = "e:/中秋节p ...

  3. python爬取简历模板_python 爬取免费简历模板网站的示例

    代码 # 免费的简历模板进行爬取本地保存 # http://sc.chinaz.com/jianli/free.html # http://sc.chinaz.com/jianli/free_2.ht ...

  4. python爬虫练习--爬取站长素材中免费简历模板

    python爬虫练习--爬取站长素材中免费简历模板 一.需求 二.代码 1. 引入库 2. main() 3. saveData(div_list) 4. 收尾 结语 一.需求 此代码是为完成波波老师 ...

  5. 【爬虫】批量爬取免费简历模板

    目的 初学爬虫进程池练习,批量爬取网站免费简历模板:点击跳转爬取网站 分析 先利用网页抓包工具可以找到每个模板所在的 div,可以看见每个模板都在一个class = "clearfix mt ...

  6. 5个免费简历模板下载网站,资源丰富,下载无套路

    分享5个免费简历模板下载网站,简历模板类型丰富而且数量多,不管需要什么样的简历几乎都能找到,而且免费下载无套路! 1.简历下载 一个完全免费的简历模板下载网站,模板数量不多,但是质量还挺高的,并且有详 ...

  7. python爬虫爬取免费简历模板实例

    爬取目标网站https://sc.chinaz.com/jianli/free.html 思路 思路捋清,直接上代码 # -*- codeing = utf-8 -*- # @Time : 2021/ ...

  8. python用requests库和xpath爬取站长素材的免费简历模板

    站长素材免费简历模板的url:https://sc.chinaz.com/jianli/free.html 开始前先说一下爬虫思路,requests和xpath简单的使用方法): 先打开网页 (分析) ...

  9. 群里又会python的吗_自从会了Python在群里斗图就没输过,Python批量下载表情包!...

    原标题:自从会了Python在群里斗图就没输过,Python批量下载表情包! 导语 最近图慌,于是随便写了个表情包批量下载的脚本,没什么技术含量,纯娱乐性质. 让我们愉快地开始吧~ 开发工具 Pyth ...

最新文章

  1. 【JavaScript总结】JavaScript语法基础:JS编码
  2. 用看板工具leangoo做需求管理,公开看板分享
  3. 先进先出置换算法(FIFO)
  4. CENTOS7.2使用RDO方式安装OpenStack Mitaka笔记
  5. ​​​​​​​CV:利用cv2(加载人脸识别xml文件及detectMultiScale函数得到人脸列表)+keras的load_model(加载表情hdf5、性别hdf5)并标注
  6. python学习日常-编码与字符串格式化
  7. leetcode53 dp and 分治
  8. shell 文件内容替换 sed用法
  9. 跨平台屏幕/摄像头RTMP推流模块设计要点
  10. jquery实现上下左右键盘监听_基于 jQuery 实现键盘事件监听控件
  11. HDU-1874畅通工程续( 最短路)
  12. hmaster和datanaode启动后很快停止_手动和全自动柴油发电机启动方法各自有什么优点?...
  13. 二进制文件和文本文件的区别
  14. 大数据开发离线计算框架知识点总结
  15. 早年的一篇关于80286保护模式的文章
  16. java 获取 海康 视频流_海康网络摄像机调用SDK解码Java版
  17. L1-058 6翻了
  18. 2.初学者初始Elasticsearch
  19. 可怕的冷读术:十二种瞬间打开陌生…
  20. adb connect 远程adb连接手机无法连接,显示由于连接方在一段时间后没有正确答复或连接的主机没有反应,连接尝试失败。(10060)windows调试Linux解决方式 ip连接方式

热门文章

  1. 开源云原生平台 KubeSphere 与 Rainbond 对比
  2. Badboy的使用教程
  3. 安防监控中网络摄像机接入拼接屏中HDMI矩阵的实际案例分析!
  4. python画对数与半对数坐标
  5. 2005.3.28 星期一 多云/晴
  6. Google hack常用搜索语法
  7. 企微 - 使用jsdk的 openDefaultBrowser 实现打开默认浏览器
  8. MPS模块式柔性自动化生产线实训系统QY-JDYT11
  9. CentOS7+Apache+PHP7.2+Mariadb环境下安装Snipe-IT资产管理系统
  10. 固定资产拆分比例怎么计算_固定资产年折旧率怎么计算?