现在AJAX的使用越来越广泛了,但是如果经常写网页抓取程序的人会发现,很多网页内容是通用AJAX进行加载的,实际抓取到的内容寥寥无几。

通过网络到处查找方法,发现用firefox浏览器能够正常把AJAX内容通过HTML呈现出来,那么是否意味着我们获取AJAX网页有希望了?

功夫不负有心人,进一步研究发现,firefox确实有一款C#组件,可以用C#集成到桌面程序中。

1)需要引用一个叫Skybound.Gecko.dll的文件。

2)此外还需要导入一个firefox支持的文件夹,代码如下:

Xpcom.Initialize(@"C:\xulrunner-1.9.1.14.en-US.win32.sdk\xulrunner-sdk\bin");

xulrunner-1.9.1.14.en-US.win32.sdk这个文件夹比较大,压缩后都有二十多M,无法上传,可以去google一下,但是记得一定要搜这个名字,因为我试过其它的有些不能用。

3)直接指定URL就可以访问网站了,可以通过this.geckoWebBrowser1.Navigate(URL);来指定。还有很多功能,自己去发现吧。

转载于:https://www.cnblogs.com/zzy2740/archive/2011/09/25/2190029.html

抓取AJAX网页的方法-Firefox组件,C#集成相关推荐

  1. 使用php简单网页抓取和内容分析,PHP抓取分析网页的方法

    这篇文章主要介绍了PHP抓取及分析网页的方法,结合实例形式详细分析了php网页抓取的原理及分析的技巧,需要的朋友可以参考下 本文实例讲述了PHP抓取及分析网页的方法.分享给大家供大家参考,具体如下: ...

  2. HtmlUnit抓取Ajax网页,例子是去哪儿机票

    htmlUnit4.2版本 package htmlunit;import java.io.IOException; import java.net.MalformedURLException; im ...

  3. python爬虫抓取动态网页数据_python网络爬虫抓取ajax动态网页数据:以抓取KFC门店地址为例...

    一,尝试用BeautifulSoup抓取 先打开KFC网站门店列表页面:http://www.kfc.com.cn/kfccda/storelist/index.aspx 可以看到门店列表如下图: 打 ...

  4. 如何让搜索引擎抓取AJAX内容

    2019独角兽企业重金招聘Python工程师标准>>> 越来越多的网站,开始采用"单页面结构"(Single-page application). 整个网站只有一 ...

  5. selenium抓取动态网页数据

    1.selenium抓取动态网页数据基础介绍 1.1 什么是AJAX AJAX(Asynchronouse JavaScript And XML:异步JavaScript和XML)通过在后台与服务器进 ...

  6. 用C#抓取AJAX页面的内容

    用C#抓取AJAX页面的内容[转] 现在的网页有相当一部分是采用了AJAX技术,不管是采用C#中的WebClient还是HttpRequest都得不到正确的结果,因为这些脚本是在服务器发送完毕后才执行 ...

  7. Python中使用PhantomJS抓取Javascript网页数据

    有些网页不是静态加载的,而是通过javascirpt函数动态加载网页,比如下面这个网页,表格中的看涨合约和看跌合约的数据都是通过javascirpt函数从后台加载.仅仅使用beautifulsoup并 ...

  8. 雪球python爬虫炒股_如何使用 Python 抓取雪球网页?

    我想使用beautifulsoup或者其他的python包 抓取 雪球网页上面的一些组合,因为雪球网的组合持仓变动的时候,雪球网不会给提示,比如说,我想抓取这个http://xueqiu.com/P/ ...

  9. python爬取网页停止_如何使用Python抓取雪球网页?

    我想使用beautifulsoup或者其他的python包 抓取 雪球网页上面的一些组合,因为雪球网的组合持仓变动的时候,雪球网不会给提示,比如说,我想抓取这个http://xueqiu.com/P/ ...

最新文章

  1. CentOS 6.7安装python3.5
  2. 使用matlab画半透明椭圆
  3. linux文件的时间格式
  4. 混凝土地坪机器人_地面整平机器人:精准又高效,轻松摆“平”混凝土
  5. HTML5边玩边学(9):俄罗斯方块就是这么简单 之 数据模型篇
  6. EhCache 常用配置项详解
  7. ExtJS下页面显示中文乱码问题
  8. opencv3.4.2调用训练好的Openpose模型
  9. 泛娱乐出海走出水土不服,元宇宙社交诞生新机会!
  10. 最简单求100以内质数算法
  11. 用WPF实现打印及打印预览
  12. 改进网易云音乐的“音乐社交”构想
  13. ipadpro画流程图_流程图制作软件,这款软件让你5分钟就能搞定流程图
  14. dreamweaver html模版,dreamweaver利用预设模板来快速的架构一个简易网站
  15. 五行代码搞定微信授权登录
  16. WLW离线编辑器的安装与使用
  17. 推荐几个帮你避坑和赚钱的公众号
  18. codeforces 549F Yura and Developers(分治、启发式合并)
  19. 11.2.0.4,ASM实例异常宕机,ORA-29740: evicted by instance number 2
  20. element 合并单元格

热门文章

  1. c++primer 3.4练习题
  2. java异常及错误处理大纲
  3. linux复制目录命令夹,linux复制目录(文件夹)和打包命令
  4. mysql获取最好成绩对应数据的其他项_开源数据同步神器——canal
  5. python 堆_面试再问你什么是堆和栈,你就把这篇文章甩给他
  6. php cookie 二级域名,php如何设置cookie对整个域名有效及二级域名
  7. mysql过滤效率和java过滤效率_如何合理选择初中高效过滤器的效率?
  8. linux cached释放_正点原子Linux第四十一章嵌入式Linux LED驱动开发实验
  9. Java管理商品信息
  10. 堆排序java实例_堆排序(示例代码)