简历模板下载

  • 工具准备
  • 项目思路解析
  • 简易源码分享

工具准备

数据来源: 站长素材
开发环境:win10、python3.7
开发工具:pycharm、Chrome

项目思路解析

找到进入详情页面的超链接地址,以及对应简历的名字
提取出参数信息

使用xpath语法的时候需要注意网页源代码跟浏览器页面渲染的页面会有出入,提取数据需要根据网页源代码来提取

    html_data = etree.HTML(page) a_list = html_data.xpath("//div[@class='box col3 ws_block']/a")  for a in a_list:resume_href = 'https:' + a.xpath('./@href')[0]  resume_name = a.xpath('./img/@alt')[0]  

进入详情页面
找到对应的详情页面的地址
提取对应rar的下载地址

        resume_tree = etree.HTML(resume_page)  resume_link = resume_tree.xpath('//ul[@class="clearfix"]/a/@href')[0]

简易源码分享

import requests
from lxml import etree headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:86.0) Gecko/20100101 Firefox/86.0',
}for i in range(2, 10):url = f'https://sc.chinaz.com/jianli/free_{str(i)}.html'  # 设置相应的路由iresponse = requests.get(url=url, headers=headers)html_data = etree.HTML(response.text)a_list = html_data.xpath("//div[@class='box col3 ws_block']/a")for a in a_list:new_url = 'https:' + a.xpath('./@href')[0]name = a.xpath('./img/@alt')[0]res = requests.get(url=new_url)  # 进入简历模板详情页面resume_tree = etree.HTML(res.text)resume_url = resume_tree.xpath('//ul[@class="clearfix"]/a/@href')[0]result = requests.get(url=resume_url, headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:86.0) Gecko/20100101 Firefox/86.0'}).content  # 获取二进制数据path = './moban/' + name + '.rar'  with open(path, 'wb') as fp:  fp.write(result)  # 保存文件

投递简历总是石沉大海?HR表现的机会都不给你?【Python爬虫实战:简历模板采集】相关推荐

  1. python爬虫实战之多线程爬取前程无忧简历

    python爬虫实战之多线程爬取前程无忧简历 import requests import re import threading import time from queue import Queu ...

  2. Python爬虫面试简历 经验分析

    分享之前的爬虫简历,仅供参考,因为技术有限,简历技能点逼格不是很高,但提到的很多爬虫常用技术,都已经写入简历,靠这份简历之前找工作时候2天预约了8家面试,面的第二天,在第4家公司通过拿到offer,后 ...

  3. python爬虫面试简历_Python爬虫面试简历

    分享之前的爬虫简历,仅供参考,因为技术有限,简历技能点逼格不是很高,但提到的很多爬虫常用技术,都已经写入简历,靠这份简历之前找工作时候2天预约了8家面试,面的第二天,在第4家公司通过拿到offer,后 ...

  4. python 爬虫 免费简历模板

    #!usr/bin/env python # -*- coding:utf-8 -*- import requests import os from lxml import etree #项目需求:解 ...

  5. python爬虫实战之爬取51job前程无忧简历

    首先F12对搜索的网页进行分析,51job网址 我们可以观察到,其网页结构比较简单,基本信息都在 p标签下 这种情况利用正则表达式可以很容易的把信息提取出来 代码如下: import urllib.r ...

  6. 就业指导——招聘信息的获取、简历投递和指导、HR面试指导

    文章目录 1. 招聘信息的获取 1.1 公司招聘官网 1.2 第三方招聘网站 1.3 微信公众号 1.4 微信群和QQ群 1.5 时间表 2. 简历投递 2.1 网申 2.2 邮件 3. 简历指导 4 ...

  7. 如何包装自己的简历?(HR眼中的好简历是什么样的?/这样写简历才会有面试机会)...

    如何包装自己的简历?(HR眼中的好简历是什么样的?/这样写简历才会有面试机会) 简历对应聘者来说很重要,那怎样包装自己的简历呢?首先要意识到简历是非常重要的,你如果简历好,才能通过面试机会拿到offe ...

  8. 想要简历“燃”到HR,必须明白这25点

            Q1.学历不高,如何在简历中弥补? 回答:学历不足可以用经验来补,可以突出自己在其他方面的优势,以吸引HR的注意.当然,如果公司明确提出非211,985毕业的不要,就不必浪费时间了 ...

  9. 我投了100多份Java简历,结果一个面试机会都没有,惨

    今天给大家聊聊咱们平时最关心的一个问题,那就是平时你写的简历为啥投出去以后都没人看!老是石沉大海!在 boss 直聘上投出去了几百份简历,大量的已读,结果就是没人理你?是不是很多兄弟都碰到过? 没关系 ...

最新文章

  1. 考研加油!考研的兄弟姐妹们!
  2. android设置title字体大小,android setTitle怎么实现字体的大小
  3. 你真的懂你的用户吗?
  4. HDU多校2 - 6763 Total Eclipse(贪心+并查集)
  5. mt5 mysql数据库_Django -- 使用MySql数据库
  6. Spring注解开发入门教程
  7. 已完成私有化交易 “网红第一股”如涵退市
  8. spring boot @value_spring+vue全栈开发实战-第二章Spring Boot 基础配置-笔记0302-2020
  9. BLE_BQB Test_Carrier frequency offset and drift, LE Coded (S=8)_RF-PHY/TRM/BV-14-C
  10. 调用百度api出现的跨域问题
  11. 微波射频网将举办“微带传输线无源交调测试可重复性”在线技术讲座
  12. 数据分析之Excel篇(三):计算统计函数
  13. 【Verilog】一、Verilog概述
  14. idea查看类层次结构图
  15. “财界奥斯卡”CGMA全球管理会计2021年度中国大奖榜单揭晓
  16. Textpad的安装和配置
  17. 解决Unity旋转改变局部坐标问题
  18. google天气服务
  19. windows系统redis和ARDM(redis客户端)下载安装步骤【非常详细】
  20. 【Simulation】2 Elements of Probability-双样本均值方差的讨论

热门文章

  1. oracle删除数据库表空间
  2. [JDBC] MySQL中数据的增查删改(二)
  3. Android的线程使用来更新UI----Thread、Handler、Looper、Time...
  4. jquery position
  5. 常见解压缩软件与其zip格式
  6. Oracle 无备份情况下的恢复--控制文件/数据文件
  7. android开发实现静默安装(fota升级)
  8. PL/SQL 实现行列转换
  9. Jenkins进阶-Gitlab使用Webhook实现Push代码自动部署(3)
  10. C++ and Java template class and function 模板类和模板函数