编程语言:java

三种工具的简要介绍:

FudanNLP

google project上的介绍是:

FudanNLP主要是为中文自然语言处理而开发的工具包,也包含为实现这些任务的机器学习算法和数据集。FudanNLP及其包含数据集使用LGPL3.0许可证。

If you're new to FudanNLP, check out the Quick Start (使用说明) page, FudanNLP Book or Java-docs.

功能有:

  1. 信息检索: 文本分类 新闻聚类
  2. 中文处理: 中文分词 词性标注 实体名识别 关键词抽取 依存句法分析 时间短语识别
  3. 结构化学习: 在线学习 层次分类 聚类 精确推理

下载地址:http://code.google.com/p/fudannlp/downloads/list

可以直接用eclipse打开,如果有错误如:找不到主类。最大可能性是主类的包或者类路径没有设正确
看看类路径和classpath变量。project-properties-java build path-libraries-add library加入相应的jre即可运行。

跑example里面的java文件试试。

中科院计算所ICTCLAS2013

[引用:http://www.blogjava.net/zhenandaci/archive/2008/09/21/230269.html]

ICTCLAS是中科院计算所出品的中文分词程序包,在国内一直有着良好的口碑和很高的使用率。之前一直只有 C++的版本提供,而现在也有C#,Delphi和Java版本.

可以不用以前的C++版提供的JNI调用,直接使用纯Java版本的ICTCLAS。

下载地址:http://ictclas.org/Down_OpenSrc.asp

解压缩,把Data文件夹整个拷贝到Eclipse项目的文件夹下,而bin目录下的org文件夹整个拷贝到你Eclipse项目的bin目录下,把src目录下的org文件夹整个拷贝到Eclipse项目的src目录下(最简单快捷的使用方式,或者你自己打成jar包,这样无论放到哪里,都可以在build path里面导入这个jar包)。

这时候,可能会有错误:org.apache.commons.lang.builder.ReflectionToStringBuilder找不到类。这时在网上找相应的类包org.apache.commons.lang下载导入,add即可。

运行,若报错:找不到主类。同上面FudanNLP所说,add library加入相应jre。

新建一个test文件夹,右键,build path-use as source folder,往里面加入一个测试文件test1.java:

import org.ictclas4j.bean.SegResult;
import org.ictclas4j.segment.SegTag;public class test1 {public static void main(String[] args){System.out.println("This is one main");SegTag st = new SegTag(1);SegResult sr = st.split("NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取。");System.out.println(sr.getFinalResult());}
}

即可运行。

转载于:https://www.cnblogs.com/linlu1142/p/3292982.html

NLP的两种工具的java版使用:复旦FudanNLP,中科院计算所ICTCLAS2013相关推荐

  1. 3ml乐谱制作工具_每个数据科学家应在其下一个ml项目中使用两种工具

    3ml乐谱制作工具 by Braden Riggs and George Williams (gwilliams@gsitechnology.com) Braden Riggs和George Will ...

  2. NLP:两种方法(自定义函数和封装函数)实现提取两人对话内容(***分隔txt文档),并各自保存为txt文档

    NLP:两种方法(自定义函数和封装函数)实现提取两人对话内容(***分隔txt文档),并各自保存为txt文档 目录 问题探究 实现代码 问题探究 实现代码 f=open("niu.txt&q ...

  3. 真假屏幕测试软件,如何检测4K电视屏幕的真伪,漏出死像素?一键识别两种工具!...

    智能电视的屏幕越来越大,越来越薄,许多品牌的电视都在4K屏幕的旗帜下,但是您真的在购买合适的电视吗?对于大屏幕智能电视,屏幕确实很重要. 购买时,您必须确保电视屏幕上没有死角,也没有非伪4K电视屏幕. ...

  4. 腾讯开放平台接口鉴权(计算签名)工具类 java版

    腾讯开放平台 接口鉴权(签名)工具类 java版 用到了Hutool工具类 package top.seasmall.platform.core.config.nettyws.util;import ...

  5. linux显示器分屏显示命令,在Linux 命令行终端分屏的两种工具

    下面介绍两种终端分屏工具:screen和tmux 一.使用screen分屏(只能上下分屏,不能左右分屏) (1)安装工具 在ubuntu系统中使用sudo apt-get install screen ...

  6. java遍历文件和归类_java读取文件的两种方法:java.io和java.lang.ClassLoader

    java读取文件的两种方法:java.io和java.lang.ClassLoader 什么时候使用java.io,什么时候使用java.lang.ClassLoader呢? (注:要是之前读xml文 ...

  7. Java使用 poi,pageOffice两种工具进行 word文件合并

    使用poi,pageOffice合并word操作.主要区别在于 poi可以进行后台操作,通过各种各样APi接口,直接进行文件io读写操作,,可用于后台操作,pageoffice需要前端预览后保存(根据 ...

  8. 比较两种php调用Java对象的方法

    Java语言功能强大,因此在许多情况下在php中来调用Java的功能将十分有用.在php中调用Java语言有两种方法,一种是使用php中 的Java扩展模块,另一种是使用minij2ee应用服务器提供 ...

  9. java excel生成_两种方式实现java生成Excel

    Web应用中难免会遇到需要将数据导出并生成excel文件的需求.同样,对于本博客中的总结,也是建立在为了完成这样的一个需求,才开始去了解其实现形式,并且顺利完成需求的开发,先将实现过程总结于此.本博文 ...

  10. JAVA线程两种方法内存,JAVA线程基础回顾及内存模型(一)

    线程创建的两种方式 继承Thread类 class MyThread extends Thread{ ...... @Override public void run(){ ...... } } My ...

最新文章

  1. QUIC实战(五) 使用nginx quic开发分支部署支持HTTP3 的NGINX
  2. html中dom多会有影响吗,DOM操作造成的页面卡顿问题及解决
  3. MOQL--面向流的统计过滤技术
  4. 今天学得有点多——end用法
  5. 转:百度又开始踢新浪屁股了
  6. ubuntu安装linux deepin,如何在ubuntu上安装如何在Ubuntu上安装Deepin桌面环境
  7. magisk卸载内置软件_安卓刷XP框架 手机通用通用(Magisk+Riru+EdXposed)
  8. MySQL DBLE_MySQL 中间件 - DBLE 简单使用
  9. 国外公路建设的能源利用
  10. PHP字节转换,KB换算MG、GB、TB
  11. python mysql版本查看_怎么查看mysql版本
  12. 暗黑2符文之语大全_暗黑破坏神2符文之语一览,附符文镶嵌顺序和底材
  13. 怎么查看war包代码
  14. 286 Walls and Gates
  15. win7个人计算机的ip地址,Win7查看ip地址命令_Win7怎么查看自己电脑ip地址?-192路由网...
  16. Word,Excel,PPT等Office文件Web浏览器在线预览
  17. python毕业设计作品基于django框架 教室实验室预约系统毕设成品(6)开题答辩PPT
  18. 关于mysql的密码
  19. 基于数据中台的数据治理解决方案
  20. 清理iNotePad的流氓病毒,iNote News垃圾弹窗

热门文章

  1. emf(Enhanced MetaFile)图片格式——在印刷工业中应用于Windows操作系统的文件格式
  2. px和毫米之间的转换
  3. Jquery斗地主牌型验证插件 1.0版
  4. 单片机控制两个步进电机画圆_单片机控制的步进电机程序框图
  5. FME实现三调地类变化流量表制作
  6. pdf转dwg为什么乱码
  7. lvds接口屏线安装图解_液晶屏上的LVDS,TTL,RSDS三种接口的详解
  8. ANSYS 2020R2 workbench汉化的方法
  9. 基于社交网络分析算法(SNA)的反欺诈(二)
  10. 视频服务器显示存储离线,云端服务器显示离线咋会事