转自:http://www.cnblogs.com/zhaopei/p/4368417.html

阅读目录

  • 效果图:
  • 第一、分析url
  • 智联招聘:
  • 猎聘网:
  • 前程无忧:
  • 第二、用到了HtmlAgilityPack.DLL ...
  • 1.设置访问url页面的编码
  • 2.元素路径下的元素集合
  • 3、取标签的属性值 Attributes
  • 4.取标签的中间的文本 InnerText
  • 5.过滤选择特定的id 或 class
  • 第三、浏览器滚动条的onscroll事件
  • 取窗口可视范围的高度[浏览器可见区域高度]
  • 取窗口滚动条高度[滚动条距离顶部的高度]
  • 取文档内容实际高度
  • 滚动条距离底部的高度

最近听得较多的跳槽、面试之类的,相信很多园友也开始蠢蠢欲动了,有的甚至早已经开始了。最近我也在琢磨着换工作的事。说得俗套点,人在外面不就为了那么点工资么。现在找工作大部分都是通过在网上投简历,然后等电话 通知面试的。然,现在的招聘网站也是比较多。一个一个的在各大网站切换的流量招聘信息 实属麻烦。之前看到过一篇博文。《找工作神器,提取各大网站有效的招聘信息(前程无忧、智联招聘、猎聘网)》感觉这想法挺好的。把各大网站信息集中起来浏览,第一省了来回切换,第二还不容易重复投简历。本想拿来用用的,无奈没有提供源码下载,且是客户端版本。于是就只能自己动手,丰衣足食了~。(网站就是强大,可以大家一起分享●0●^_^)

合并查询本来就是为了简单方便,所以也就没有弄很复杂了,一个页面搞定。如果同学们有什么好的想法,可以建议建议。

效果图:

就一个简单的关键字输入框、工作地点的选择和信息来源网站。

其实看上去很简单,实现起来也很简单。~~代码不多,难度也很小。很多时候需要的技术不是很多,想法更重要。

不想往下看的可以直接用用 演示地址 ,同学们求工作给推荐推荐,上海 浦东 .net。 私密我,或Q我。

第一、分析url

进入招聘网站的时候url大串大串的,我们需要用的的就三个。搜索关键字、地址和页码。

智联招聘:

http://sou.zhaopin.com/jobs/searchresult.ashx?jl=地址&kw=关键字&p=页码

jl=地址

kw=关键字

p=页码

然后地址的话 直接中文地址就ok了

猎聘网:

http://www.liepin.com/zhaopin/?key=关键字&dqs=地址&curPage=页码

key=关键字

dqs=地址

curPage=页码

地址有一个对应的编号

("北京", "010");
("上海", "020");
("广州", "050020");...等等  也是在猎聘网选择地址的地方右键 审查元素可以看到,如下:

前程无忧:

http://search.51job.com/jobsearch/search_result.php?jobarea=地址&keyword=关键字&curr_page=页码

jobarea=地址 [和猎聘一样的查找方法]

keyword=关键字

curr_page=页码

第二、用到了HtmlAgilityPack.DLL HTML解析组件

在之前我发过的 博客转发小工具 有提过HtmlAgilityPack。这里再简单的说说用法。

case ZhaopinType.猎聘网:var htmlWeb = new HtmlWeb();htmlWeb.OverrideEncoding = Encoding.GetEncoding("UTF-8");HtmlAgilityPack.HtmlDocument response = htmlWeb.Load(url);#region MyRegionvar ulS = response.DocumentNode.SelectNodes("//*[@id='sojob']/div[2]/div/div/ul/li");foreach (var item in ulS){var xpath = item.XPath;string titleName, infourl, company, city, date, salary, salary_em, source;titleName = item.SelectSingleNode(xpath + "/a").Attributes["title"].Value;infourl = item.SelectSingleNode(xpath + "/a").Attributes["href"].Value;company = item.SelectSingleNode(xpath + "/a/dl/dt[@class='company']").InnerText;city = item.SelectSingleNode(xpath + "/a/dl/dt[@class='city']/span").InnerText;date = item.SelectSingleNode(xpath + "/a/dl/dt[@class='date']/span").InnerText;salary = item.SelectSingleNode(xpath + "/a/dl/dt[@class='salary']/span").InnerText;salary_em = item.SelectSingleNode(xpath + "/a/dl/dt[@class='salary']/em").InnerText;source = "猎聘网";zpInfoList.Add(new ZhaopinInfo(){city = city,company = company,date = date,info_url = infourl,salary = salary,salary_em = salary_em,titleName = titleName,source = source});}#endregionbreak;

1.设置访问url页面的编码

htmlWeb.OverrideEncoding = Encoding.GetEncoding("UTF-8");

设置编码为UTF-8,具体看对应页面采用的编码。

2.元素路径下的元素集合

var ulS = response.DocumentNode.SelectNodes("//*[@id='sojob']/div[2]/div/div/ul/li");

SelectNodes方法里面的这串字符串怎么来?

右键审查元素 Copy XPath 就ok了。不过如果js有动态修改document树的话 那么这个路径就不准了,需要自己微调下。

3、取标签的属性值 Attributes

如:取a标签的title值。

titleName = item.SelectSingleNode(xpath + "/a").Attributes["title"].Value;

4.取标签的中间的文本 InnerText

company = item.SelectSingleNode(xpath + "/a/dl/dt[@class='company']").InnerText;

5.过滤选择特定的id 或 class

XPath 中 标签名后面加上中括号 和@ 如: "/a/dl/dt[@class='company']"

第三、浏览器滚动条的onscroll事件

js获取滚动条距离浏览器顶部,底部的高度,兼容ie和firefox

取窗口可视范围的高度[浏览器可见区域高度]

//取窗口可视范围的高度[浏览器可见区域高度]getClientHeight: function () {var clientHeight = 0;if (document.body.clientHeight && document.documentElement.clientHeight) {var clientHeight = (document.body.clientHeight < document.documentElement.clientHeight) ? document.body.clientHeight : document.documentElement.clientHeight;} else {var clientHeight = (document.body.clientHeight > document.documentElement.clientHeight) ? document.body.clientHeight : document.documentElement.clientHeight;}return clientHeight;}

取窗口滚动条高度[滚动条距离顶部的高度]

  getScrollTop: function () {var scrollTop = 0;if (document.documentElement && document.documentElement.scrollTop) {scrollTop = document.documentElement.scrollTop;} else if (document.body) {scrollTop = document.body.scrollTop;}return scrollTop;}

取文档内容实际高度

  getScrollHeight: function () {return Math.max(document.body.scrollHeight, document.documentElement.scrollHeight);}

滚动条距离底部的高度

getScrollbheight: function () { return this.getScrollHeight() - this.getScrollTop() - this.getClientHeight(); }

取滚动条距离底部的高度,当滚动条到最底部的时候,通过ajax异步请求后台,加载下一页数据,这样就可以免了翻页的麻烦了。

ps:用jquery 更加简洁(感谢@Samguist)

if ($(window).scrollTop() == $(document).height() - $(window).height()) {
// ajax异步加载数据
}

基本上就是这样简单,没什么难度。记得有什么好工作通知一声哦~^_^ ^_^   ***** 点击本人求职信息*****

环境:vs2013   数据库:无   插件:HtmlAgilityPack   演示地址  源码下载  (源码都下了 顺手点个赞呗~)

本文转自张昺华-sky博客园博客,原文链接:http://www.cnblogs.com/sky-heaven/p/5775761.html,如需转载请自行联系原作者

牛人博客!!!各大招聘网站信息实时查询浏览【转】相关推荐

  1. 各大招聘网站信息实时查询浏览

    阅读目录 最近听得较多的跳槽.面试之类的,相信很多园友也开始蠢蠢欲动了,有的甚至早已经开始了.最近我也在琢磨着换工作的事.说得俗套点,人在外面不就为了那么点工资么.现在找工作大部分都是通过在网上投简历 ...

  2. 计算机视觉领域的一些牛人博客,超有实力的研究机构等的网站链接(转 )

    计算机视觉领域的一些牛人博客,超有实力的研究机构等的网站链接 (1)googleResearch: http://research.google.com/index.html (2)MIT博士,汤晓欧 ...

  3. Android牛人博客集合

    最近看到别人两个月时间锻炼成安卓大神,真心牛逼,每晚两点多睡,向他人学习! 两个月学会安卓并且技术还是大神的博客地址 http://blog.csdn.net/u011068702/article/c ...

  4. 【转】计算机视觉领域的一些牛人博客,超有实力的研究机构等的网站链接

    提示:本文为笔者原创,转载请注明出处:blog.csdn.net/carson2005 以下链接是本人整理的关于计算机视觉(ComputerVision, CV)相关领域的网站链接,其中有CV牛人的主 ...

  5. 计算机视觉领域的一些牛人博客,超有实力的研究机构等的网站链接---个人整理...

    提示:本文为笔者原创,转载请注明出处:blog.csdn.net/carson2005 以下链接是本人整理的关于计算机视觉(ComputerVision, CV)相关领域的网站链接,其中有CV牛人的主 ...

  6. 计算机视觉领域的一些牛人博客,研究机构等的网站链接

    以下链接是本人整理的关于计算机视觉(ComputerVision, CV)相关领域的网站链接,其中有CV牛人的主页,CV研究小组的主页,CV领域的paper,代码,CV领域的最新动态,国内的应用情况等 ...

  7. 计算机视觉领域的一些牛人博客,研究机构等的网站链接 机器学习算法中文视频教程

    转自:http://www.cnblogs.com/Rick-w/archive/2012/04/14/2446921.html http://blog.csdn.net/Luckily118/art ...

  8. 牛人博客汇总之摘抄(Talk is cheap, show me the code.)

    http://blog.csdn.net/zjf280441589/article/details/26058431 1.读书计划的第一步是选择书籍,我曾向当时我觉得很牛的"学长" ...

  9. 机器视觉与机器学习牛人博客

    https://blog.csdn.net/leadai/article/details/79798774 http://www.360doc.com/content/14/0528/13/10724 ...

最新文章

  1. 14_传智播客iOS视频教程_instancetype
  2. 你也可以设计简单的内容管理系统
  3. 导入android studio项目,编译失败
  4. 枚举法 之Java实现凑硬币
  5. Zookeeper 夺命连环 9 问
  6. Echarts2 grid属性
  7. 会计学原理与财务报表分析
  8. 我的大脑越来越喜欢那些碎片化的、不用思考的文章了!
  9. 网络广告行业资料整理
  10. 微信怎么加入黑名单?微信黑名单怎么恢复好友
  11. 类似易企秀的UI框架 整屏滑动
  12. 通过身份证号码得出性别和年龄
  13. 双鱼板mind+环境下设置
  14. cosolog打印带样式的文字及图片
  15. 【Flink实战系列】Flink 1.11.1 on yarn 集群搭建教程
  16. 计算机网络之在浏览器输入“www.xxx.com”后都发生了什么?
  17. 无源晶振用示波器如何测量
  18. 一位牛人写的关于开关电源的啸叫原因经验,比较实用!
  19. 记录盈透IBKR IBAPI Quant过程
  20. 三十学艺与 Linux Networking Cookbook

热门文章

  1. Python——eventlet.websocket
  2. 博客堂也遇DotText经典Exception
  3. [python教程入门学习]Python是什么?
  4. android编程fragment,Android中关于FragmentA嵌套FragmentB的问题
  5. 怎么获取请求头中的origin信息_委托单位代办汇算清缴时无法获取到我的专项附加扣除信息怎么办?...
  6. php time 毫秒_PHP获取当前时间的毫秒数
  7. XML DOM – 导航节点概述
  8. k8s-harbor安装
  9. Kruskal算法模版
  10. 贪心 ---- 贪心 + STL维护 + 划分集合 L. Neo-Robin Hood(好题)