基本环境配置

1、requests,用于模拟http/https请求

安装: pip install requests

2、beautifulsoup4,用于解析网页,得出我们想要的内容。

安装: pip install beautifulsoup4

3、xlwt,将爬到的结果以Excel的形式保存到本地

安装: pip install xlwt
api: xlwt api

打开网页

首先打开boss直聘官网,选择一个地点,然后输入关键字,点击搜索,这里以深圳、python为例。

观察地址栏URL,可以发现有四个参数,分别是query,city,industry和position,query和city很明显是我输入的python和选择的地点深圳;而industry和position也就是公司行业和职位类型,这里没有选择这两项。

分析网页

F12打开开发者工具

每一条职位信息都在一个<li>标签中,<li>标签下的<div class=“job-primary”>就是我们要找的内容。

代码

获取城市编码

url中的city=101280600,显示的是深圳,说明城市名有一个对应的编号,F12 点击Network选中XHR,有一个city.json

完整代码

xhr请求python_python爬取boss直聘职位数据,并保存到本地相关推荐

  1. selenium自动化爬取Boss直聘职位数据 按照热门城市

    from selenium import webdriver import time import re import pandas as pd import os  在爬取的过程中可能会有登陆弹窗, ...

  2. 使用python爬取BOSS直聘岗位数据并做可视化(Boss直聘对网页做了一些修改,现在的代码已经不能用了)

    使用python爬取BOSS直聘岗位数据并做可视化 结果展示 首页 岗位信息 岗位详情 薪资表 学历需求 公司排名 岗位关键词 福利关键词 代码展示 爬虫代码 一.导入库 二.爬取数据 1.爬取数据代 ...

  3. Python爬虫:爬取“Boss直聘”招聘数据

    hello 大家好~ 又是元气满满的一天呢~ 既然元气满满,要不要搞点事情,譬如说,爬取"Boss直聘"(此处模仿歪果仁讲话更带感)的招聘数据~ 说走咱就走,说干咱就干~" ...

  4. python爬取boss直招_简易python爬虫爬取boss直聘职位,并写入excel

    1,默认城市是杭州,代码如下 #! -*-coding:utf-8 -*- from urllib import request, parse from bs4 import BeautifulSou ...

  5. boss直聘python_简易python爬虫爬取boss直聘职位,并写入excel

    #! -*-coding:utf-8 -*- from urllib import request, parse from bs4 import BeautifulSoup import dateti ...

  6. scrapy框架爬取Boss直聘,数据存入mysql

    自从上次用了scrapy爬取豆瓣电影后,发现scrapy除了入门相对request较难外,各方面都挺好的,速度很快,还有各个功能模块,以及django类似的各种中间件组成一个完善的系统框架,需要一点一 ...

  7. Python爬虫入门教程32:爬取boss直聘招聘数据并做可视化展示

    前言

  8. 【数据分析项目实战】Python爬取BOSS直聘岗位和数据分析

    说明:这是一个数据分析项目全流程(附带项目实例),本篇教程来源于网络,胖哥对此进行了完整的梳理,并把用到的数据+代码完全奉上.如需数据+完整代码可以直接到文章最后获取. 这里面的数据,我只爬取了部分, ...

  9. python爬取boss直聘招聘信息_Python笔记-爬取Boss直聘的招聘信息

    2018-05-09笔记: 最近迷上了爬虫,爬取招聘信息,存在MongoDB上 代码思路和上一篇爬取酷狗TOP500差不多,但是在使用CSS选择器的时候,有两组信息是连在一起,所以使用正则来获取 本来 ...

最新文章

  1. 防抖 节流_关于防抖和节流
  2. Java程序员从阿里拿到offer回来,这些面试题你会吗?
  3. Frame Buster Buster ......需要buster代码
  4. pb调用c语言dll,PB调用C#编写的Dll类库
  5. sh变量特性(3)默认特性
  6. 通过设计国际象棋游戏来了解策略模式
  7. win10分辨率不能调整_Win10系统分辨率不能修改怎么办?屏幕分辨率的调节方法...
  8. JavaScript进阶(一)--执行上下文
  9. Swift-EasingAnimation
  10. 优衣库试衣间又出事了!惊现针孔摄像头 回应:正全力配合警方调查
  11. python未定义名称大小_名称错误:未定义名称“高度”
  12. HDU 5183 Negative and Positive (NP) (hashmap+YY)
  13. logitech鼠标接收器配对
  14. 数据库查看内存,数据大小
  15. 九宫格六边形html,六边形拼图
  16. 编码,隐匿在计算机软硬件背后的语言读书笔记(1)
  17. java.net.ServerSocket详解
  18. 语言表达的6c原则是指什么,第二讲 BEC写作的语言、语法、组织和文体
  19. 【转】浅谈C# 多态的法力
  20. 全球首发!惯性导航导论(剑桥大学)第三部分

热门文章

  1. C++ OpenCV形态学操作--开闭操作,形态学梯度,顶帽,黑帽
  2. OpenResty中遇到Can't locate Time/HiRes.pm in @INC问题的解决方法
  3. Blender中的主程序纹理学习课程 Master Procedural Texturing in Blender
  4. 手把手教你 用C++实现一个 可持久化 的http_server
  5. leetcode-206 反转链表
  6. 关于timewait状态
  7. 如何判断CPU、内存、磁盘的性能瓶颈?
  8. 一:HDFS 用户指导
  9. 在CentOS 7中安装与配置Tomcat-8方法
  10. ubuntu修改主机名后无法解析主机