NCrawler是一款国外的开源网络爬虫软件,遵循LGPL许可协议。其HTML处理使用的是htmlagilitypack开源库,采用xpath的方式处理定位网页元素,十分方便。同时其采用HttpWebRequest异步的方式获取网页,采集效率较高。台湾微软MSDN有一篇如何使用NCrawler参考文章。

官方地址:http://ncrawler.codeplex.com/

转载于:https://www.cnblogs.com/shanyou/archive/2012/07/31/2617485.html

网络采集库NCrawler相关推荐

  1. android post请求添加公共参数_XHttp2 一个功能强悍的网络请求库

    XHttp2 一个功能强悍的网络请求库,使用RxJava2 + Retrofit2 + OKHttp组合进行封装.还不赶紧点击使用说明文档,体验一下吧! 项目地址 关于我 https://github ...

  2. 利用epoll写一个迷你的网络事件库

    epoll是linux下高性能的IO复用技术,是Linux下多路复用IO接口select/poll的增强版本,它能显著提高程序在大量并发连接中只有少量活跃的情况下的系统CPU利用率.另一点原因就是获取 ...

  3. python 访问网页 重定向_Python数据网络采集5--处理Javascript和重定向

    Python数据网络采集5--处理Javascript和重定向 到目前为止,我们和网站服务器通信的唯一方式,就是发出HTTP请求获取页面.有些网页,我们不需要单独请求,就可以和网络服务器交互(收发信息 ...

  4. 最好用的嵌入式网络C库、Lua库

    为什么80%的码农都做不了架构师?>>>    最好用的嵌入式网络C库.Lua库 Evmongoose是一个异步的.基于事件框架(libev)的集成多种协议的嵌入式网络库,包括:TC ...

  5. 兼容微信小程序的流式网络请求库

    本项目从属于笔者的Web开发入门与最佳实践之前端开源项目系列.如果对于HTTP协议与规范尚不掌握的建议阅读HTTP 基础与变迁一文.如果对于REST尚不掌握的推荐阅读来自微软的接口设计指南以及来自于P ...

  6. Python网络请求库Requests,妈妈再也不会担心我的网络请求了(二)

    本文同步发表于我的微信公众号,扫一扫文章底部的二维码或在微信搜索 极客导航 即可关注,每个工作日都有文章更新. 一.概况 接着上篇说,如果你真以为Requests网络请求库只有Get请求和Post请求 ...

  7. 「Python 编程」编码实现网络请求库中的 URL 解析器

    相信各位 Python 开发者都用过 Requests 库,有些朋友还用过 WebSockets 库.这里回顾一下它们的基本用法,例如使用 Requests 库向目标网站发出 GET 请求: impo ...

  8. 吕文翰 php,自己动手写一个 iOS 网络请求库(三)——降低耦合

    自己动手写一个 iOS 网络请求库(三)--降低耦合 2015-5-22 / 阅读数:16112 / 分类: iOS & Swift 本文中,我们将一起降低之前代码的耦合度,并使用适配器模式实 ...

  9. WinCap网络开发库入门(转)

    Winpcap是一个强大的网络开发库,可以实现许多功能:获取可用的网络适配器:获取指定适配器信息(比如名称和描述信息):捕获指定网卡的数据封包:发送数据封包:过滤捕获的包以获取特定包等. 文章源地址: ...

最新文章

  1. 本科-人工智能复习题
  2. rocketMq-producer介绍
  3. Kotlin与Java的几种单例模式
  4. C语言调用python代码
  5. NSURLSession的应用
  6. 32汇编语言程序说明_Linux 汇编语言学习--编译和链接
  7. 硬解析优化_72最近一次现场生产系统优化的成果与开发建议
  8. char类型怎么输入 c语言_c语言入门(一)
  9. Widget实例可以添加多个并独立更新
  10. mysql5.6二进制包_MySQL 5.6版本二进制包多实例安装
  11. 如何修正EPS编辑框中汉字输入显示为问号
  12. 2.cycloneIII系列FPGA下载模式的配置
  13. 腾讯优图招聘计算机视觉日常实习生
  14. 完蛋,公司被一条 update 语句干趴了!
  15. Docker官方教程
  16. mysql注入时的注释处理
  17. Hybrid App开发实战
  18. 论文精读2: Ground-to-Aerial Image Geo-LocalizationWith a Hard Exemplar Reweighting Triplet Loss
  19. 基于Ardupilot/PX4固件,APM/PIXhawk硬件的VTOL垂直起降固定翼软硬件参数调试(第四篇)飞行特性
  20. 读《熵减 华为活力之源》

热门文章

  1. input内容右对齐_向右打方向倒库过程中,如何判断后车距离?光线较暗车库倒库技巧...
  2. Qt工作笔记-依赖于QAbstractTableModel实现自定义TableModel
  3. java 保留html_好程序员Java培训分享Java包是什么?
  4. php 重新编译_linux下为php添加GD库(重新编译php)
  5. java setpriority_Java TaskEntity.setPriority方法代碼示例
  6. c语言 隐式声明,关于C#:隐式函数声明和链接
  7. isvisible java_.NET(C#) Selenium操作调用浏览器判断页面元素(ElementIsVisible)可见的方法...
  8. 华为云牵手同舟共济伙伴 持续发力构建云核心生态圈
  9. Android 中opengl es灯光效果实例
  10. 计组之存储系统:2、SRAM(区别、栅极电容、双稳态触发器、DRAM刷新、地址复用)和DRAM(MROM、PROM、EPROM、EEPROM)