Ictclas50是一个分词库,我嘛主要用来做中文分词,其也能分出词性等东西。

1.环境搭建

进入到下载页面进行下载:

如下图: 因为我的系统是64位的windows,所以选择了到数第三行进行下载。其JAVA版本是通过JNI去调用dll库,所以下载下来后没有jar包。看到没有,这就是下载下来后的所有东西,里面有Demo,Doc,API,Sample,主要就是Doc里面的文档要去看一下,里面有实例代码啥的。还有就是API,自然是用来开发用的。

把API文件夹里面的东西都拖入到你的工程中,其中ICTCLAS文件夹拖入工程目录下的src文件夹中,这样之后就可以开始使用里ICTCLAS50这个类进行分词了。

2.测试:

查看下ICTCLAS50这个类里面的代码可以看出,其很简单,里面就几个函数,具体用法参见doc文件夹里的文档,里面都有说明和示例。

下面就是那几个函数:

以下为测试代码:

package test;

import java.io.UnsupportedEncodingException;

import ICTCLAS.I3S.AC.ICTCLAS50;

public class test {

/**

* @param args

*/

public static void main(String[] args) {

ICTCLAS50 ictclas50 = new ICTCLAS50();

String argu = ".";

try {

if (ictclas50.ICTCLAS_Init(argu.getBytes("GB2312")) == false)

{

System.out.println("Init Fail!");

}

String text = "loma在做一个分词测试";

//分词处理

byte nativeBytes1[] = ictclas50.ICTCLAS_ParagraphProcess(text.getBytes("GB2312"), 2, 0);

String nativeStr1 = new String(nativeBytes1, 0, nativeBytes1.length, "GB2312");

System.out.println(nativeStr1);

ictclas50.ICTCLAS_Exit();

} catch (UnsupportedEncodingException e) {

e.printStackTrace();

}

}

}

输出结果:

空格有点小,要睁大眼睛哦~

里面还能输出词性啥的,请看doc里面的文档。

java 调用 ictclas50_1-Ictclas50分词系统ForJava相关推荐

  1. ZH奶酪:Java调用NLPIR汉语分词系统

    NLPIR工具 支持自定义词表: 可以离线使用: 下载地址:http://ictclas.nlpir.org/newsdownloads?DocId=389 在线演示:http://ictclas.n ...

  2. java调用solr的分词查询结果

    java调用solr的分词查询结果 https://www.jianshu.com/p/cb4cc151d23c

  3. java 调用 ictclas50_中科院分词ICTCLAS5.0_JNI 使用方法

    1.简介 中国科学院计算技术研究所在多年研究基础上,耗时一年研制出了基于多层隐码模型的汉语词法分析系统 ICTCLAS(Institute of Computing Technology, Chine ...

  4. Python下如何调用NLPIR(ICTCLAS2013)分词系统

    NLPIR汉语分词系统-Python下如何调用NLPIR(ICTCLAS2013) 在国内研究自然语言处理的人大概都知道ICTCLAS分词系统的大名.该系统是由张华平博士开发的基于层叠隐性马可夫链的分 ...

  5. 基于Java实现的中文分词系统

    资源下载地址:https://download.csdn.net/download/sheziqiong/85941192 资源下载地址:https://download.csdn.net/downl ...

  6. ictclas分词系统 java_1-Ictclas50分词系统ForJava

    Ictclas50是一个分词库,我嘛主要用来做中文分词,其也能分出词性等东西. 1.环境搭建 进入到下载页面进行下载: 如下图: 因为我的系统是64位的windows,所以选择了到数第三行进行下载.其 ...

  7. java调用命令行校对系统时间

    电脑时间长了发现系统时间不准确,每次手动调整太麻烦,就自己写个程序校正一下 首先linux下设置时间 date -s "2023-01-29 11:12:13",普通执行没问题,放 ...

  8. java 调用 ikAnalyzer

    下载地址: http://pan.baidu.com/s/1dFDffDB 解压缩后,有如下文件: 其中,lucene-core-3.6.0.jar 是作者自行加入的,编译时需要.该版本的IKAnal ...

  9. ictclas包 java_ICTCLAS分词系统Java调用接口在Eclipse中的安装

    ICTCLAS分词系统Java调用接口在Eclipse中的安装 实验环境:JDK1.5.Eclipse3.1.XP操作系统 分词系统Java接口解压包:d:\fenci(http://www.nlp. ...

最新文章

  1. 既是移动硬盘也是微型计算机,既是移动硬盘也是微型计算机 Gnarbox 2.0 SSD让你随时随地备份自己的照片...
  2. python编程基础人民邮电出版社_Python编程基础与应用
  3. linux indent命令: 调整C原始代码文件的格式
  4. linux git diff patch,拿到git patch要怎麼用一般patch指令merge?
  5. java pdf增删改查_如何利用Java代码操作索引库?
  6. jinja Macros
  7. VBto Converter代码转换工具最新V2.89版
  8. 美国阿肯色州闪电彩虹共享一片天空(组图)
  9. opencv实现人脸识别和眼部识别
  10. Unity3d资源反编译. AssetBundle格式简析+简单应用+爬坑
  11. 图片从base64编码转换为jpg文件
  12. OpenGL---GLUT教程(九) GLUT鼠标
  13. 教你用python画不同类型的心形图虏获芳心,值得收藏!!
  14. 移动端app设计开发经验之设计篇
  15. 机器学习发展历史(符号学习、统计机器学习、深度学习)
  16. 电脑PDF阅读+谷歌翻译
  17. 华为metro1000描述,optix metro1000参数-华讯佳科技
  18. Java的内部类详解(成员内部类、静态内部类、局部内部类、匿名内部类)
  19. 系统优化之大循环在内,小循环主外为什么会效率高
  20. 俞敏洪 同济大学演讲

热门文章

  1. swift x输入流_Swift 中不同窗体的切换和传递数据 (segue 的用法)
  2. mysqld已删除但仍占用空间的_Windows 10删除备份文件方法
  3. 【javascript高级教程】JavaScript Number 对象
  4. 读《第一次把事情做对》有感
  5. css3优惠卷上方锯齿_css3怎么实现锯齿边框?
  6. 小学阅读方法六种_小学生掌握了这些语文答题方法,轻松应对阅读理解,不再是难事...
  7. java 什么是耦合_什么是耦合、解耦
  8. 外包以小时计算金额的费用_2020年初级会计各大税种的计算公式,请收藏!
  9. C# 查询一张表的数据用于补充另外一张表的数据 MySQL数据库
  10. Vue $nextTick