前言:作者(守望者MS)在实际搭建并开发Nutch的过程中参阅很多中文资料,但内容并不详尽且有错误,于是在此记录个人实战过程,纠正一些文章错误,以详细的过程展现一次简单的二次开发流程,为初学者降低门槛。但不能保证完全没有错误,如有发现希望大家指正。

本文出自 “守望者MS” 博客,谢绝转载!

目录:

1.Nutch1.2二次开发详细攻略(一)【图文】------Windows平台下Cygwin环境的搭建

2.Nutch1.2二次开发详细攻略(二)【图文】------Windows平台下Nutch1.2的搭建

3.Nutch1.2二次开发详细攻略(三)【图文】------Nutch1.2二次开发(关于界面修改)

4.Nutch1.2二次开发详细攻略(四)【图文】------Nutch1.2二次开发(关于中文分词)

一、开发环境介绍(以我个人为例):

个人开发端:windows Server 2003 + Cygwin + Eclipse3.2

二、具体步骤:

1.下载并安装Cygwin(http://cygwin.com/install.html)

<1>.安装Cygwin

点击下载好的setup.exe

选择下一步。

选择第一项Install from Internet。

选择安装目录(视个人情况而定)。下一步

选择从网上下载的Package的存放目录。下一步

如果你本机现在不是用代理上网,请默认选择第一项并点击下一步。

选择cygwin镜像下载站点,现在国内提供镜像的只有163,所以国内的用户默认选择第一项是比较好的选择。

接下来的一步是最重要,也是我要重点强调的,我初次接触Nutch,并在windows平台下安装Cygwin时,参阅网上资料说这一步应该选择全部安装,否则会很多错误,当时信以为真,为避免后面开发出现错误,于是选择下载全部package,无奈在服务器上下载了2天,都没有下载完成。最后经过实践证明,这一步执行默认的选项即可(整个安装过程只需耗费5分钟左右),没有必要全部下载所有的包。详情见下图。

关于Cygwin接下来安装就是一直点击下一步即可。

<2>.配置cygwin

安装完毕cygwin之后,最重要的操作就是为Cygwin配置环境变量。

在编辑系统变量中的Path,在期变量值中添加上你的Cygwin安装目录下bin文件夹的绝对路径。

例如我的是G:\cygwin\bin.

至此,在windows平台上开发搭建Nutch的第一步已完成,成功安装cygwin。

转载于:https://www.cnblogs.com/streamhope/archive/2011/07/27/2118397.html

Nutch1.2二次开发详细攻略(一)【图文】------Windows平台下Cygwin环境的搭建相关推荐

  1. BigData/Cloud Computing:购买并登录Windows弹性云服务器之详细攻略(图文教程)—更优惠、更贴心!

    BigData/Cloud Computing:购买并登录Windows弹性云服务器之详细攻略(图文教程)-更优惠.更贴心! 导读:弹性云服务器(Elastic Cloud Server)是由CPU. ...

  2. VB.net:VB.net编程语言学习之基于VS软件利用VB.net语言实现对SolidWorks进行二次开发的简介、案例应用之详细攻略

    VB.net:VB.net编程语言学习之基于VS软件利用VB.net语言实现对SolidWorks进行二次开发的简介.案例应用之详细攻略 目录 调用SolidWorks功能简介 1.宏录制步骤 (1) ...

  3. IT:后端进阶技术路线图(初级→中级→高级)、后端开发工程师(技术方向分类之后台业务开发/中间件/内核/分布式架构)基础知识简介、技术路线/技术趋势指南(如何选择自己的技术方向)之详细攻略

    IT:后端进阶技术路线图(初级→中级→高级).后端开发工程师(技术方向分类之后台业务开发/中间件/内核/分布式架构)基础知识简介.技术路线/技术趋势指南(如何选择自己的技术方向)之详细攻略 目录 后端 ...

  4. Computer:少儿编程—每个人都应该学习编程,它能教你如何思考—编程入门的简介(编程语言的特点种类开发工具对比人类语言)、编程应用、编程意义之详细攻略

    Computer:少儿编程-每个人都应该学习编程,它能教你如何思考-编程入门的简介(编程语言的特点&种类&开发工具&对比人类语言).编程应用.编程意义之详细攻略 导读:乔布斯说 ...

  5. DataScience:风控场景之金融评分卡模型的构建(逻辑回归)开发(转评分卡)、使用过程(线上实现)之详细攻略

    DataScience:风控场景之金融评分卡模型的构建(逻辑回归)&开发(转评分卡).使用过程(线上实现)之详细攻略 目录 风控场景之金融评分卡模型的构建(逻辑回归)&开发(转评分卡) ...

  6. DataScience:风控场景之金融评分卡模型的简介、构建(逻辑回归)开发(转评分卡)、使用过程(线上实现)之详细攻略

    DataScience:风控场景之金融评分卡模型的简介.构建(逻辑回归)&开发(转评分卡).使用过程(线上实现)之详细攻略 目录 逻辑回归之金融评分卡模型的简介.构建.开发.使用过程 1.金融 ...

  7. BigData:大数据开发的简介、核心知识(linux基础+Java/Python编程语言+Hadoop{HDFS、HBase、Hive}+Docker)、经典场景应用之详细攻略

    BigData:大数据开发的简介.核心知识(linux基础+Java/Python编程语言+Hadoop{HDFS.HBase.Hive}+Docker).经典场景应用之详细攻略 BigData:大数 ...

  8. WeChat:微信小程序设计流程注册完善、设计开发、审核发布之详细攻略

    WeChat:微信小程序设计流程注册&完善.设计&开发.审核&发布之详细攻略 目录 微信小程序设计流程 1.注册 2.小程序信息完善 3.开发小程序 3.1.开发文档 3.2. ...

  9. Python语言学习之pandas:DataFrame二维表的简介、常用函数、常用案例之详细攻略

    Python语言学习之pandas:DataFrame二维表的简介.常用函数.常用案例之详细攻略 目录 DataFrame的简介 DataFrame的常用案例 1.写入和读取excel表格文件

  10. Python:Python多种集成开发环境(IDE,编译器)的简介、安装、入门、使用方法之详细攻略

    Python:Python多种集成开发环境(IDE,编译器)的简介.安装.入门.使用方法之详细攻略 目录 Python多种编译器的简介.安装.入门.使用方法 1.Anaconda 2.ipython ...

最新文章

  1. “臭名昭著”的他们终于被裁了!字节宣布将精简HR团队,网友:业界毒瘤!...
  2. 自定义notebook扩展插件_Jupyter notebook安装扩展插件
  3. Spring使用到了那些接口/第三方框架
  4. 0-1背包 java_0-1背包问题,java的动态规划如题,代码如下public
  5. inline ,inline-block ,block
  6. Spring+Mybatis多数据源配置(三)——Spring如何获取Properties文件的信息
  7. 前端程序升级linux方案,开源:AspNetCore 应用程序热更新升级工具(全网第一份公开的解决方案)...
  8. MDC功能软件-感知融合算法介绍
  9. java功能模块_Java 13功能
  10. 强化学习 RL - DQN - 智能体Agent
  11. Python安装Tensorflow
  12. risksystem_环境风险评价系统(RiskSystem)
  13. 即时通讯视频聊天原理是什么
  14. python排序算法——冒泡排序时间复杂度
  15. 淮安颜老师计算机,颜老师_以老师为话题的作文750字_独木帆作文网
  16. 浅析帧、帧数、帧率、FPS区别
  17. 【Android 逆向】ELF 文件格式 ( 安装 010 Editor 二进制查看工具的 ELF.bt 插件模板 | 安装 ELF.bt 模板 | 打开 ELF 文件 )
  18. 揭密 HAP 激光雷达的实际性能表现
  19. Zeppelin Job monitor打开
  20. (STM32笔记5)ws2812驱动开发

热门文章

  1. java jdbc close原理_Java开发笔记(一百四十六)JDBC的应用原理
  2. 三包围结构的字是什么样的_清桦学书之结构篇——包围结构。
  3. 电脑下载python3.5.2教程_Win10系统如何搭建Python 3.5.2开发环境
  4. Python--正则表达式
  5. php 可逆加密方法
  6. 客户端考试之渐进增强与优雅降级
  7. codeforces 584E Anton and Ira [想法题]
  8. IE无法执行JavaScript解决办法
  9. C# 判断字符中是否包含中文
  10. Linux errno的含义【转】