python爬取智联招聘_【原创源码】python 爬取智联招聘
[Python] 纯文本查看 复制代码from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.keys import Keys
from pyquery import PyQuery as pq
import time
class ZhiLian:
def __init__(self):
# 设置 chrome 无界面化模式
self.chrome_options = Options()
self.chrome_options.add_argument('--headless')
self.chrome_options.add_argument('--disable-gpu')
self.driver = webdriver.Chrome(chrome_options=self.chrome_options)
def get_url(self, search='python'):
"""
获取搜索职位的url, demo里面默认搜索python
:param search:
:return:
"""
self.driver.get("https://www.zhaopin.com/")
element = self.driver.find_element_by_class_name("zp-search__input")
element.send_keys(f"{search}")
element.send_keys(Keys.ENTER)
# 切换窗口
self.driver.switch_to.window(self.driver.window_handles[1])
# 等待js渲染完成后,在获取html
time.sleep(4)
html = self.driver.find_element_by_xpath("//*").get_attribute("outerHTML")
return html
def data_processing(self):
"""
处理数据
:return:
"""
html = self.get_url()
doc = pq(html)
contents = doc(".contentpile__content__wrapper")
for content in contents.items():
jobname = content(".contentpile__content__wrapper__item__info__box__jobname__title").text()
companyname = content(".contentpile__content__wrapper__item__info__box__cname").text()
saray = content(".contentpile__content__wrapper__item__info__box__job__saray").text()
demand = content(".contentpile__content__wrapper__item__info__box__job__demand").text()
yield jobname, companyname, saray, ",".join(demand.split("\n"))
datas = ZhiLian().data_processing()
for data in datas:
print(data)
python爬取智联招聘_【原创源码】python 爬取智联招聘相关推荐
- 【原创源码】(05):C#-计算绝对路径。
[原创源码](05):C#-计算绝对路径. 欢迎大家发表意见(漏洞,性能等).在博客园社区以外转载,请注明作者和出处.谢谢! /**//// <summary> ...
- 原创源码用fastadmin框架制作可做导航站还可以做api接口站点页面非常漂亮
原创源码用fastadmin框架制作可做导航站还可以做api接口站点页面非常漂亮 前端是看见一个站点非常不错做出来的 后台用的fastadmin最新框架制作 制作好了就打包整站分享 可二开 非常不错 ...
- python爬网页数据用什么_初学者如何用“python爬虫”技术抓取网页数据?
原标题:初学者如何用"python爬虫"技术抓取网页数据? 在当今社会,互联网上充斥着许多有用的数据.我们只需要耐心观察并添加一些技术手段即可获得大量有价值的数据.而这里的&quo ...
- 利用python爬取知乎评论_一个简单的python爬虫,爬取知乎
一个简单的python爬虫,爬取知乎 主要实现 爬取一个收藏夹 里 所有问题答案下的 图片 文字信息暂未收录,可自行实现,比图片更简单 具体代码里有详细注释,请自行阅读 项目源码: 1 # -*- c ...
- python爬取大众点评数据_利用Node.js制作爬取大众点评的爬虫
前言 Node.js天生支持并发,但是对于习惯了顺序编程的人,一开始会对Node.js不适应,比如,变量作用域是函数块式的(与C.Java不一样):for循环体({})内引用i的值实际上是循环结束之后 ...
- python老师 招聘_崩了,Python玩大了! 程序员:牛,不可惜!
Python真的玩大了吗? 2020年,Python程序员究竟怎么样? A与B 程序员与远方 近日日本最大的证券公司之一野村证券首席数字官马修·汉普森,在Quant Conference上发表讲话:& ...
- python招聘信息-【Python招聘_最新热搜Python人才招聘信息】-前程无忧
学历要求:本科|工作经验:2年|公司性质:民营公司|公司规模:150-500人 岗位职责:1.承接公司业务线产品后端服务的开发和维护工作:2.参与设计所负责产品模块的前后台技术框架和实现方案,独立完成 ...
- python培训的课时是多久_如何快速学习python,学习python的最短时间是多久?
在我们即将迈入python培训课堂之前,你肯定很关注学习python的最短时间是多久,怎样才能快速学习python等问题,今天就为大家详细地回答一下这个问题,希望对你有所帮助! 这篇文章将为你的自学之 ...
- python在建筑施工方面的应用_有哪些关于 Python 在建筑中的应用和教程?
2018.02.09更新 (發現距離上一次更新馬上就要兩年了--) 嗯,兩年間發生了很多事.我也莫名其妙跑到ETH來了. 做起了Fab的優化,python已經完全不能滿足效率和複雜度的要求,走上了C+ ...
最新文章
- 详细理解JS中的继承
- 抽象泄漏,或如何正确地将Oracle DATE与Hibernate绑定
- 多核电脑的配件(CPU)
- 信奥中的数学:信息论基础
- 安装python遇到错误_安装Python时遇到如下问题,解决方案
- 记录一下代码编辑器的主题修改
- 2006年星座运势全解-射手
- JDY-24M主机使用手册
- linux cat 颜色,使用lolcat为您的Linux终端带来彩虹般美丽的色彩
- 继续教育-职场学习法 试题及答案
- 新建UEFI启动分区
- OVP 过压保护电路
- 当限量潮牌遇到 DeFi, 币圈项目社群当投机时尚结合加密基元
- Samba之打印机共享配置nbsp;(CUPS…
- Livox激光MID-360使用与fast-lio2激光SLAM建图
- 截至2021年10月29日,安卓系统版本和Api Level对照表
- 美团点评面试题目(2019)
- 阿里云服务器系统(linux)配置nginx
- c语言算钢丝杨氏模量实验报告,大学物理实验报告-钢丝杨氏模量测量.doc
- Docker入门(一)