投递简历总是石沉大海?HR表现的机会都不给你?【Python爬虫实战:简历模板采集】
简历模板下载
- 工具准备
- 项目思路解析
- 简易源码分享
工具准备
数据来源: 站长素材
开发环境:win10、python3.7
开发工具:pycharm、Chrome
项目思路解析
找到进入详情页面的超链接地址,以及对应简历的名字
提取出参数信息
使用xpath语法的时候需要注意网页源代码跟浏览器页面渲染的页面会有出入,提取数据需要根据网页源代码来提取
html_data = etree.HTML(page) a_list = html_data.xpath("//div[@class='box col3 ws_block']/a") for a in a_list:resume_href = 'https:' + a.xpath('./@href')[0] resume_name = a.xpath('./img/@alt')[0]
进入详情页面
找到对应的详情页面的地址
提取对应rar的下载地址
resume_tree = etree.HTML(resume_page) resume_link = resume_tree.xpath('//ul[@class="clearfix"]/a/@href')[0]
简易源码分享
import requests
from lxml import etree headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:86.0) Gecko/20100101 Firefox/86.0',
}for i in range(2, 10):url = f'https://sc.chinaz.com/jianli/free_{str(i)}.html' # 设置相应的路由iresponse = requests.get(url=url, headers=headers)html_data = etree.HTML(response.text)a_list = html_data.xpath("//div[@class='box col3 ws_block']/a")for a in a_list:new_url = 'https:' + a.xpath('./@href')[0]name = a.xpath('./img/@alt')[0]res = requests.get(url=new_url) # 进入简历模板详情页面resume_tree = etree.HTML(res.text)resume_url = resume_tree.xpath('//ul[@class="clearfix"]/a/@href')[0]result = requests.get(url=resume_url, headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:86.0) Gecko/20100101 Firefox/86.0'}).content # 获取二进制数据path = './moban/' + name + '.rar' with open(path, 'wb') as fp: fp.write(result) # 保存文件
投递简历总是石沉大海?HR表现的机会都不给你?【Python爬虫实战:简历模板采集】相关推荐
- python爬虫实战之多线程爬取前程无忧简历
python爬虫实战之多线程爬取前程无忧简历 import requests import re import threading import time from queue import Queu ...
- Python爬虫面试简历 经验分析
分享之前的爬虫简历,仅供参考,因为技术有限,简历技能点逼格不是很高,但提到的很多爬虫常用技术,都已经写入简历,靠这份简历之前找工作时候2天预约了8家面试,面的第二天,在第4家公司通过拿到offer,后 ...
- python爬虫面试简历_Python爬虫面试简历
分享之前的爬虫简历,仅供参考,因为技术有限,简历技能点逼格不是很高,但提到的很多爬虫常用技术,都已经写入简历,靠这份简历之前找工作时候2天预约了8家面试,面的第二天,在第4家公司通过拿到offer,后 ...
- python 爬虫 免费简历模板
#!usr/bin/env python # -*- coding:utf-8 -*- import requests import os from lxml import etree #项目需求:解 ...
- python爬虫实战之爬取51job前程无忧简历
首先F12对搜索的网页进行分析,51job网址 我们可以观察到,其网页结构比较简单,基本信息都在 p标签下 这种情况利用正则表达式可以很容易的把信息提取出来 代码如下: import urllib.r ...
- 就业指导——招聘信息的获取、简历投递和指导、HR面试指导
文章目录 1. 招聘信息的获取 1.1 公司招聘官网 1.2 第三方招聘网站 1.3 微信公众号 1.4 微信群和QQ群 1.5 时间表 2. 简历投递 2.1 网申 2.2 邮件 3. 简历指导 4 ...
- 如何包装自己的简历?(HR眼中的好简历是什么样的?/这样写简历才会有面试机会)...
如何包装自己的简历?(HR眼中的好简历是什么样的?/这样写简历才会有面试机会) 简历对应聘者来说很重要,那怎样包装自己的简历呢?首先要意识到简历是非常重要的,你如果简历好,才能通过面试机会拿到offe ...
- 想要简历“燃”到HR,必须明白这25点
Q1.学历不高,如何在简历中弥补? 回答:学历不足可以用经验来补,可以突出自己在其他方面的优势,以吸引HR的注意.当然,如果公司明确提出非211,985毕业的不要,就不必浪费时间了 ...
- 我投了100多份Java简历,结果一个面试机会都没有,惨
今天给大家聊聊咱们平时最关心的一个问题,那就是平时你写的简历为啥投出去以后都没人看!老是石沉大海!在 boss 直聘上投出去了几百份简历,大量的已读,结果就是没人理你?是不是很多兄弟都碰到过? 没关系 ...
最新文章
- 考研加油!考研的兄弟姐妹们!
- android设置title字体大小,android setTitle怎么实现字体的大小
- 你真的懂你的用户吗?
- HDU多校2 - 6763 Total Eclipse(贪心+并查集)
- mt5 mysql数据库_Django -- 使用MySql数据库
- Spring注解开发入门教程
- 已完成私有化交易 “网红第一股”如涵退市
- spring boot @value_spring+vue全栈开发实战-第二章Spring Boot 基础配置-笔记0302-2020
- BLE_BQB Test_Carrier frequency offset and drift, LE Coded (S=8)_RF-PHY/TRM/BV-14-C
- 调用百度api出现的跨域问题
- 微波射频网将举办“微带传输线无源交调测试可重复性”在线技术讲座
- 数据分析之Excel篇(三):计算统计函数
- 【Verilog】一、Verilog概述
- idea查看类层次结构图
- “财界奥斯卡”CGMA全球管理会计2021年度中国大奖榜单揭晓
- Textpad的安装和配置
- 解决Unity旋转改变局部坐标问题
- google天气服务
- windows系统redis和ARDM(redis客户端)下载安装步骤【非常详细】
- 【Simulation】2 Elements of Probability-双样本均值方差的讨论
热门文章
- oracle删除数据库表空间
- [JDBC] MySQL中数据的增查删改(二)
- Android的线程使用来更新UI----Thread、Handler、Looper、Time...
- jquery position
- 常见解压缩软件与其zip格式
- Oracle 无备份情况下的恢复--控制文件/数据文件
- android开发实现静默安装(fota升级)
- PL/SQL 实现行列转换
- Jenkins进阶-Gitlab使用Webhook实现Push代码自动部署(3)
- C++ and Java template class and function 模板类和模板函数