准备着手抓取网页上的免费信息,用来产生一些有价值的趋势信息。第一次发现招聘信息可以反映一个行业的发展状况,是一个不错的趋势指标。

举例来说明:

下面代码将查询百度的某一个行业的招聘关键字,例如大数据的招聘信息,如果将这个数据每天的都记录下来,就可以追踪大数据行业的发展趋势。

#encoding:utf8

import urllib2
import re
__author__ = 'jason'
def read_job_from_baidu(url_baidu):
    url = url_baidu
    response = urllib2.urlopen(url)#访问百度
    result = response.read()
    result_str= result.decode("gbk")#从gbk转换为unicode
    job_count_str=re.search(u"共找到"+".*?"+u"个相关职位",result_str)#搜索职位的特征字符串
    search_result=job_count_str.group()
    search_result=search_result.replace(u"共找到","")#去掉无关字符
    search_result=search_result.replace(u"个相关职位","")
    #print search_result
    return search_result

if __name__ == "__main__":
    big_data_url="http://opendata.baidu.com/zhaopin/?ie=gbk&p=mini&rn=20&wd=%D5%D0%C6%B8+%B4%F3%CA%FD%BE%DD"
    result=read_job_from_baidu(big_data_url)
    print result #后续可以将这个结果保存到数据库,将上述稍加改造就可以用来跟踪各行各业的求职相关的趋势信息,每天都保存下来,经过时间的积累,你就能得到一个很好的趋势分析数据。是不是很厉害?
    #print job_count_str.group()
    #print result

python 抓百度招聘信息,将搜索结果解析下来,用来跟踪招聘趋势数据,免费数据变为有用的东东相关推荐

  1. 使用Python抓取网页信息

    之前用C#帮朋友写了一个抓取网页信息的程序,搞得好复杂,今天朋友又要让下网页数据,好多啊,又想偷懒,可是不想用C#了,于是想到了Python,大概花了两个小时,用记事本敲的,然后在IDLE (Pyth ...

  2. python爬取boss直聘招聘信息_Python笔记-爬取Boss直聘的招聘信息

    2018-05-09笔记: 最近迷上了爬虫,爬取招聘信息,存在MongoDB上 代码思路和上一篇爬取酷狗TOP500差不多,但是在使用CSS选择器的时候,有两组信息是连在一起,所以使用正则来获取 本来 ...

  3. boss直聘怎么发招聘信息_被聘为开发人员:高级招聘人员的提示

    boss直聘怎么发招聘信息 There's no magic bullet for getting hired as a developer. But there is some great advi ...

  4. python抓取网页信息_python抓取网页中的动态数据

    一.概念 网页中的许多数据并不是写死在HTML中的,而是通过js动态载入的.所以也就引出了什么是动态数据的概念,动态数据在这里指的是网页中由Javascript动态生成的页面内容,是在页面加载到浏览器 ...

  5. python 抓取google play 各搜索词排名

    背景: 做app推广的时候需要看各 搜索词搜到的各app的排名 需要的结果: 在https://play.google.com/apps 中搜索某关键词,如browser 抓取页面返回的所有app,并 ...

  6. python抓取网页信息保存为xml文件_用Python抓取XML文件

    如果您能够对文档运行xslt-我想您可以-另一种方法将使这变得非常简单:<?xml version="1.0" encoding="utf-8"?> ...

  7. php只取时间的下士_闲来无聊,用python抓取天气信息,简单就是美啊

    #encoding:UTF-8 ''' @author: ahuaxuan (张荣华) @date: 2009-02-06 ''' import re from httplib import HTTP ...

  8. python爬取的信息条数比页面显示多_Python爬取分析北京二手房数据?数据结果真的太吓人了...

    有个朋友联系我,想统计一下北京二手房的相关的数据,而自己用Excel统计工作量太过于繁杂,问我用Python该如何实现. 构造要访问的URL 这里,我试着抓取北京海淀区二手房的相关数据.首先,是观察一 ...

  9. python抓主力资金_【邢不行|量化小讲堂系列09-Python量化入门】通过逐笔数据计算主力资金流数据...

    引言: 邢不行的系列帖子"量化小讲堂",通过实际案例教初学者使用python进行量化投资,了解行业研究方向,希望能对大家有帮助. [历史文章汇总]请点击此处 [必读文章]EOS期现 ...

  10. 海阳最新计算机招聘信息,海阳找工作|海阳人才网|海阳全职招聘信息-烟台58同城...

    9000-15000元/月 广告 包吃 包住 交通补助 饭补 加班补助 普工&nbsp&nbsp|&nbsp&nbsp不限&nbsp&nbsp|& ...

最新文章

  1. 利用js对页面数据进行排序
  2. 苹果电脑适合python吗_m1的MacBook pro适合python开发吗?
  3. Jest + React Testing Library 单测总结
  4. java NIO网络编程之SelectionKey
  5. Mybatis Generator 自动生成数据库XML(Mybatis Generator 逆向工程)
  6. java实现simhash算法
  7. 数组累加兼eval性能测试
  8. C++ vector理解
  9. (进阶)python实现库存商品管理系统
  10. Cousera Notebook 之 Python 备份记录
  11. 《从0开始学大数据》的启示
  12. HoloLens初入——研究模式
  13. 给大家分享一下指纹挂锁的方案
  14. 高版本CAD画直线时,点击F8正交卡死解决方法
  15. ts服务器cal文件激活,付费网课ts文件如何解密?m3u8无IV信息
  16. Spring MVC 教程详解 个人总结 复习必备 面试宝典 狂神笔记
  17. 【ELT.ZIP】OpenHarmony啃论文俱乐部——综述视角解读压缩编码
  18. [system] systemd详解
  19. Excel B2B商机跟踪报表
  20. 显卡硬件加速,导致不能播放视频

热门文章

  1. 解决仙剑奇侠传“应用程序无法正常启动(0xc000000d)”的问题【转载】
  2. 蓝牙耳机音量控制问题
  3. 微信小程序模板消息接口下线了,不用慌,调用统一服务消息接口来实现相同功能
  4. Elastic-Job-分布式定时任务框架(张亮原著)
  5. SAP 未审批的采购订单(PO)提交到OA去审批,最后OA审批结果回写到SAP。
  6. SQL简体转繁体互换(常用汉字词组)
  7. android 主题颜色意义
  8. 如何在云帮上配置https
  9. 通过终端命令查看到目的IP所经过的路由
  10. 前馈神经网络(Feedforward neural network)