NLP的两种工具的java版使用:复旦FudanNLP,中科院计算所ICTCLAS2013
编程语言:java
三种工具的简要介绍:
FudanNLP
google project上的介绍是:
FudanNLP主要是为中文自然语言处理而开发的工具包,也包含为实现这些任务的机器学习算法和数据集。FudanNLP及其包含数据集使用LGPL3.0许可证。
If you're new to FudanNLP, check out the Quick Start (使用说明) page, FudanNLP Book or Java-docs.
功能有:
- 信息检索: 文本分类 新闻聚类
- 中文处理: 中文分词 词性标注 实体名识别 关键词抽取 依存句法分析 时间短语识别
- 结构化学习: 在线学习 层次分类 聚类 精确推理
下载地址:http://code.google.com/p/fudannlp/downloads/list
可以直接用eclipse打开,如果有错误如:找不到主类。最大可能性是主类的包或者类路径没有设正确
看看类路径和classpath变量。project-properties-java build path-libraries-add library加入相应的jre即可运行。
跑example里面的java文件试试。
中科院计算所ICTCLAS2013
[引用:http://www.blogjava.net/zhenandaci/archive/2008/09/21/230269.html]
ICTCLAS是中科院计算所出品的中文分词程序包,在国内一直有着良好的口碑和很高的使用率。之前一直只有 C++的版本提供,而现在也有C#,Delphi和Java版本.
可以不用以前的C++版提供的JNI调用,直接使用纯Java版本的ICTCLAS。
下载地址:http://ictclas.org/Down_OpenSrc.asp
解压缩,把Data文件夹整个拷贝到Eclipse项目的文件夹下,而bin目录下的org文件夹整个拷贝到你Eclipse项目的bin目录下,把src目录下的org文件夹整个拷贝到Eclipse项目的src目录下(最简单快捷的使用方式,或者你自己打成jar包,这样无论放到哪里,都可以在build path里面导入这个jar包)。
这时候,可能会有错误:org.apache.commons.lang.builder.ReflectionToStringBuilder找不到类。这时在网上找相应的类包org.apache.commons.lang下载导入,add即可。
运行,若报错:找不到主类。同上面FudanNLP所说,add library加入相应jre。
新建一个test文件夹,右键,build path-use as source folder,往里面加入一个测试文件test1.java:
import org.ictclas4j.bean.SegResult; import org.ictclas4j.segment.SegTag;public class test1 {public static void main(String[] args){System.out.println("This is one main");SegTag st = new SegTag(1);SegResult sr = st.split("NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取。");System.out.println(sr.getFinalResult());} }
即可运行。
转载于:https://www.cnblogs.com/linlu1142/p/3292982.html
NLP的两种工具的java版使用:复旦FudanNLP,中科院计算所ICTCLAS2013相关推荐
- 3ml乐谱制作工具_每个数据科学家应在其下一个ml项目中使用两种工具
3ml乐谱制作工具 by Braden Riggs and George Williams (gwilliams@gsitechnology.com) Braden Riggs和George Will ...
- NLP:两种方法(自定义函数和封装函数)实现提取两人对话内容(***分隔txt文档),并各自保存为txt文档
NLP:两种方法(自定义函数和封装函数)实现提取两人对话内容(***分隔txt文档),并各自保存为txt文档 目录 问题探究 实现代码 问题探究 实现代码 f=open("niu.txt&q ...
- 真假屏幕测试软件,如何检测4K电视屏幕的真伪,漏出死像素?一键识别两种工具!...
智能电视的屏幕越来越大,越来越薄,许多品牌的电视都在4K屏幕的旗帜下,但是您真的在购买合适的电视吗?对于大屏幕智能电视,屏幕确实很重要. 购买时,您必须确保电视屏幕上没有死角,也没有非伪4K电视屏幕. ...
- 腾讯开放平台接口鉴权(计算签名)工具类 java版
腾讯开放平台 接口鉴权(签名)工具类 java版 用到了Hutool工具类 package top.seasmall.platform.core.config.nettyws.util;import ...
- linux显示器分屏显示命令,在Linux 命令行终端分屏的两种工具
下面介绍两种终端分屏工具:screen和tmux 一.使用screen分屏(只能上下分屏,不能左右分屏) (1)安装工具 在ubuntu系统中使用sudo apt-get install screen ...
- java遍历文件和归类_java读取文件的两种方法:java.io和java.lang.ClassLoader
java读取文件的两种方法:java.io和java.lang.ClassLoader 什么时候使用java.io,什么时候使用java.lang.ClassLoader呢? (注:要是之前读xml文 ...
- Java使用 poi,pageOffice两种工具进行 word文件合并
使用poi,pageOffice合并word操作.主要区别在于 poi可以进行后台操作,通过各种各样APi接口,直接进行文件io读写操作,,可用于后台操作,pageoffice需要前端预览后保存(根据 ...
- 比较两种php调用Java对象的方法
Java语言功能强大,因此在许多情况下在php中来调用Java的功能将十分有用.在php中调用Java语言有两种方法,一种是使用php中 的Java扩展模块,另一种是使用minij2ee应用服务器提供 ...
- java excel生成_两种方式实现java生成Excel
Web应用中难免会遇到需要将数据导出并生成excel文件的需求.同样,对于本博客中的总结,也是建立在为了完成这样的一个需求,才开始去了解其实现形式,并且顺利完成需求的开发,先将实现过程总结于此.本博文 ...
- JAVA线程两种方法内存,JAVA线程基础回顾及内存模型(一)
线程创建的两种方式 继承Thread类 class MyThread extends Thread{ ...... @Override public void run(){ ...... } } My ...
最新文章
- QUIC实战(五) 使用nginx quic开发分支部署支持HTTP3 的NGINX
- html中dom多会有影响吗,DOM操作造成的页面卡顿问题及解决
- MOQL--面向流的统计过滤技术
- 今天学得有点多——end用法
- 转:百度又开始踢新浪屁股了
- ubuntu安装linux deepin,如何在ubuntu上安装如何在Ubuntu上安装Deepin桌面环境
- magisk卸载内置软件_安卓刷XP框架 手机通用通用(Magisk+Riru+EdXposed)
- MySQL DBLE_MySQL 中间件 - DBLE 简单使用
- 国外公路建设的能源利用
- PHP字节转换,KB换算MG、GB、TB
- python mysql版本查看_怎么查看mysql版本
- 暗黑2符文之语大全_暗黑破坏神2符文之语一览,附符文镶嵌顺序和底材
- 怎么查看war包代码
- 286 Walls and Gates
- win7个人计算机的ip地址,Win7查看ip地址命令_Win7怎么查看自己电脑ip地址?-192路由网...
- Word,Excel,PPT等Office文件Web浏览器在线预览
- python毕业设计作品基于django框架 教室实验室预约系统毕设成品(6)开题答辩PPT
- 关于mysql的密码
- 基于数据中台的数据治理解决方案
- 清理iNotePad的流氓病毒,iNote News垃圾弹窗