python 抓百度招聘信息,将搜索结果解析下来,用来跟踪招聘趋势数据,免费数据变为有用的东东
准备着手抓取网页上的免费信息,用来产生一些有价值的趋势信息。第一次发现招聘信息可以反映一个行业的发展状况,是一个不错的趋势指标。
举例来说明:
下面代码将查询百度的某一个行业的招聘关键字,例如大数据的招聘信息,如果将这个数据每天的都记录下来,就可以追踪大数据行业的发展趋势。
#encoding:utf8
import urllib2
import re
__author__ = 'jason'
def read_job_from_baidu(url_baidu):
url = url_baidu
response = urllib2.urlopen(url)#访问百度
result = response.read()
result_str= result.decode("gbk")#从gbk转换为unicode
job_count_str=re.search(u"共找到"+".*?"+u"个相关职位",result_str)#搜索职位的特征字符串
search_result=job_count_str.group()
search_result=search_result.replace(u"共找到","")#去掉无关字符
search_result=search_result.replace(u"个相关职位","")
#print search_result
return search_result
if __name__ == "__main__":
big_data_url="http://opendata.baidu.com/zhaopin/?ie=gbk&p=mini&rn=20&wd=%D5%D0%C6%B8+%B4%F3%CA%FD%BE%DD"
result=read_job_from_baidu(big_data_url)
print result #后续可以将这个结果保存到数据库,将上述稍加改造就可以用来跟踪各行各业的求职相关的趋势信息,每天都保存下来,经过时间的积累,你就能得到一个很好的趋势分析数据。是不是很厉害?
#print job_count_str.group()
#print result
python 抓百度招聘信息,将搜索结果解析下来,用来跟踪招聘趋势数据,免费数据变为有用的东东相关推荐
- 使用Python抓取网页信息
之前用C#帮朋友写了一个抓取网页信息的程序,搞得好复杂,今天朋友又要让下网页数据,好多啊,又想偷懒,可是不想用C#了,于是想到了Python,大概花了两个小时,用记事本敲的,然后在IDLE (Pyth ...
- python爬取boss直聘招聘信息_Python笔记-爬取Boss直聘的招聘信息
2018-05-09笔记: 最近迷上了爬虫,爬取招聘信息,存在MongoDB上 代码思路和上一篇爬取酷狗TOP500差不多,但是在使用CSS选择器的时候,有两组信息是连在一起,所以使用正则来获取 本来 ...
- boss直聘怎么发招聘信息_被聘为开发人员:高级招聘人员的提示
boss直聘怎么发招聘信息 There's no magic bullet for getting hired as a developer. But there is some great advi ...
- python抓取网页信息_python抓取网页中的动态数据
一.概念 网页中的许多数据并不是写死在HTML中的,而是通过js动态载入的.所以也就引出了什么是动态数据的概念,动态数据在这里指的是网页中由Javascript动态生成的页面内容,是在页面加载到浏览器 ...
- python 抓取google play 各搜索词排名
背景: 做app推广的时候需要看各 搜索词搜到的各app的排名 需要的结果: 在https://play.google.com/apps 中搜索某关键词,如browser 抓取页面返回的所有app,并 ...
- python抓取网页信息保存为xml文件_用Python抓取XML文件
如果您能够对文档运行xslt-我想您可以-另一种方法将使这变得非常简单:<?xml version="1.0" encoding="utf-8"?> ...
- php只取时间的下士_闲来无聊,用python抓取天气信息,简单就是美啊
#encoding:UTF-8 ''' @author: ahuaxuan (张荣华) @date: 2009-02-06 ''' import re from httplib import HTTP ...
- python爬取的信息条数比页面显示多_Python爬取分析北京二手房数据?数据结果真的太吓人了...
有个朋友联系我,想统计一下北京二手房的相关的数据,而自己用Excel统计工作量太过于繁杂,问我用Python该如何实现. 构造要访问的URL 这里,我试着抓取北京海淀区二手房的相关数据.首先,是观察一 ...
- python抓主力资金_【邢不行|量化小讲堂系列09-Python量化入门】通过逐笔数据计算主力资金流数据...
引言: 邢不行的系列帖子"量化小讲堂",通过实际案例教初学者使用python进行量化投资,了解行业研究方向,希望能对大家有帮助. [历史文章汇总]请点击此处 [必读文章]EOS期现 ...
- 海阳最新计算机招聘信息,海阳找工作|海阳人才网|海阳全职招聘信息-烟台58同城...
9000-15000元/月 广告 包吃 包住 交通补助 饭补 加班补助 普工  |  不限  |& ...
最新文章
- 利用js对页面数据进行排序
- 苹果电脑适合python吗_m1的MacBook pro适合python开发吗?
- Jest + React Testing Library 单测总结
- java NIO网络编程之SelectionKey
- Mybatis Generator 自动生成数据库XML(Mybatis Generator 逆向工程)
- java实现simhash算法
- 数组累加兼eval性能测试
- C++ vector理解
- (进阶)python实现库存商品管理系统
- Cousera Notebook 之 Python 备份记录
- 《从0开始学大数据》的启示
- HoloLens初入——研究模式
- 给大家分享一下指纹挂锁的方案
- 高版本CAD画直线时,点击F8正交卡死解决方法
- ts服务器cal文件激活,付费网课ts文件如何解密?m3u8无IV信息
- Spring MVC 教程详解 个人总结 复习必备 面试宝典 狂神笔记
- 【ELT.ZIP】OpenHarmony啃论文俱乐部——综述视角解读压缩编码
- [system] systemd详解
- Excel B2B商机跟踪报表
- 显卡硬件加速,导致不能播放视频