java 调用 ictclas50_1-Ictclas50分词系统ForJava
Ictclas50是一个分词库,我嘛主要用来做中文分词,其也能分出词性等东西。
1.环境搭建
进入到下载页面进行下载:
如下图: 因为我的系统是64位的windows,所以选择了到数第三行进行下载。其JAVA版本是通过JNI去调用dll库,所以下载下来后没有jar包。看到没有,这就是下载下来后的所有东西,里面有Demo,Doc,API,Sample,主要就是Doc里面的文档要去看一下,里面有实例代码啥的。还有就是API,自然是用来开发用的。
把API文件夹里面的东西都拖入到你的工程中,其中ICTCLAS文件夹拖入工程目录下的src文件夹中,这样之后就可以开始使用里ICTCLAS50这个类进行分词了。
2.测试:
查看下ICTCLAS50这个类里面的代码可以看出,其很简单,里面就几个函数,具体用法参见doc文件夹里的文档,里面都有说明和示例。
下面就是那几个函数:
以下为测试代码:
package test;
import java.io.UnsupportedEncodingException;
import ICTCLAS.I3S.AC.ICTCLAS50;
public class test {
/**
* @param args
*/
public static void main(String[] args) {
ICTCLAS50 ictclas50 = new ICTCLAS50();
String argu = ".";
try {
if (ictclas50.ICTCLAS_Init(argu.getBytes("GB2312")) == false)
{
System.out.println("Init Fail!");
}
String text = "loma在做一个分词测试";
//分词处理
byte nativeBytes1[] = ictclas50.ICTCLAS_ParagraphProcess(text.getBytes("GB2312"), 2, 0);
String nativeStr1 = new String(nativeBytes1, 0, nativeBytes1.length, "GB2312");
System.out.println(nativeStr1);
ictclas50.ICTCLAS_Exit();
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
}
}
输出结果:
空格有点小,要睁大眼睛哦~
里面还能输出词性啥的,请看doc里面的文档。
java 调用 ictclas50_1-Ictclas50分词系统ForJava相关推荐
- ZH奶酪:Java调用NLPIR汉语分词系统
NLPIR工具 支持自定义词表: 可以离线使用: 下载地址:http://ictclas.nlpir.org/newsdownloads?DocId=389 在线演示:http://ictclas.n ...
- java调用solr的分词查询结果
java调用solr的分词查询结果 https://www.jianshu.com/p/cb4cc151d23c
- java 调用 ictclas50_中科院分词ICTCLAS5.0_JNI 使用方法
1.简介 中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了基于多层隐码模型的汉语词法分析系统 ICTCLAS(Institute of Computing Technology, Chine ...
- Python下如何调用NLPIR(ICTCLAS2013)分词系统
NLPIR汉语分词系统-Python下如何调用NLPIR(ICTCLAS2013) 在国内研究自然语言处理的人大概都知道ICTCLAS分词系统的大名.该系统是由张华平博士开发的基于层叠隐性马可夫链的分 ...
- 基于Java实现的中文分词系统
资源下载地址:https://download.csdn.net/download/sheziqiong/85941192 资源下载地址:https://download.csdn.net/downl ...
- ictclas分词系统 java_1-Ictclas50分词系统ForJava
Ictclas50是一个分词库,我嘛主要用来做中文分词,其也能分出词性等东西. 1.环境搭建 进入到下载页面进行下载: 如下图: 因为我的系统是64位的windows,所以选择了到数第三行进行下载.其 ...
- java调用命令行校对系统时间
电脑时间长了发现系统时间不准确,每次手动调整太麻烦,就自己写个程序校正一下 首先linux下设置时间 date -s "2023-01-29 11:12:13",普通执行没问题,放 ...
- java 调用 ikAnalyzer
下载地址: http://pan.baidu.com/s/1dFDffDB 解压缩后,有如下文件: 其中,lucene-core-3.6.0.jar 是作者自行加入的,编译时需要.该版本的IKAnal ...
- ictclas包 java_ICTCLAS分词系统Java调用接口在Eclipse中的安装
ICTCLAS分词系统Java调用接口在Eclipse中的安装 实验环境:JDK1.5.Eclipse3.1.XP操作系统 分词系统Java接口解压包:d:\fenci(http://www.nlp. ...
最新文章
- 既是移动硬盘也是微型计算机,既是移动硬盘也是微型计算机 Gnarbox 2.0 SSD让你随时随地备份自己的照片...
- python编程基础人民邮电出版社_Python编程基础与应用
- linux indent命令: 调整C原始代码文件的格式
- linux git diff patch,拿到git patch要怎麼用一般patch指令merge?
- java pdf增删改查_如何利用Java代码操作索引库?
- jinja Macros
- VBto Converter代码转换工具最新V2.89版
- 美国阿肯色州闪电彩虹共享一片天空(组图)
- opencv实现人脸识别和眼部识别
- Unity3d资源反编译. AssetBundle格式简析+简单应用+爬坑
- 图片从base64编码转换为jpg文件
- OpenGL---GLUT教程(九) GLUT鼠标
- 教你用python画不同类型的心形图虏获芳心,值得收藏!!
- 移动端app设计开发经验之设计篇
- 机器学习发展历史(符号学习、统计机器学习、深度学习)
- 电脑PDF阅读+谷歌翻译
- 华为metro1000描述,optix metro1000参数-华讯佳科技
- Java的内部类详解(成员内部类、静态内部类、局部内部类、匿名内部类)
- 系统优化之大循环在内,小循环主外为什么会效率高
- 俞敏洪 同济大学演讲
热门文章
- swift x输入流_Swift 中不同窗体的切换和传递数据 (segue 的用法)
- mysqld已删除但仍占用空间的_Windows 10删除备份文件方法
- 【javascript高级教程】JavaScript Number 对象
- 读《第一次把事情做对》有感
- css3优惠卷上方锯齿_css3怎么实现锯齿边框?
- 小学阅读方法六种_小学生掌握了这些语文答题方法,轻松应对阅读理解,不再是难事...
- java 什么是耦合_什么是耦合、解耦
- 外包以小时计算金额的费用_2020年初级会计各大税种的计算公式,请收藏!
- C# 查询一张表的数据用于补充另外一张表的数据 MySQL数据库
- Vue $nextTick