http://hi.baidu.com/tanzhangwen/item/ab7c0909699546dddce5b006

本文由twenz整理。

以前ICTCLAS官方网站上并没有官方的java版本,只有一些爱好者根据c++改写的几个java版本供下载。2011/2009则提供了官方的java调用版本,但分词程序的实现应该还是基于c++的dll文件,只是提供了java的借口。下面简要介绍eclipse中使用ICTCLAS2011的简要步骤:

1. 下载最新版的分词开源软件ICTCLAS的java版(Windows)

ICTCLAS2011_Windows_32_jni

http://ictclas.org/ictclas_download.asp

2. 将ICTCLAS加入到工程中

下载的ICTCLAS50_Windows_32_JNI.rar\Sample\ictclas_sample_java解压到所建立的java工程中,如果工程中代码是放在src文件中的话,则可以把解压后的ICTCLAS文件夹拷贝到src源码文件夹中去

3. 运行分词软件ICTCLAS

将解压后的文件TestMain.java复制到工程的源码中去,即可以运行并分词。

4. 添加用户自定义的词典

由于提供的词典的词的数量不多,如“与时俱进”这一成语都不能分好,另外一些领域的词也没有,这样需要我们在用户词典中添加我们需要的词语。在解压的文件中有一个userdict.txt的文件,可以加入一些用户自定义的词语用作分词的词典。文件中有:

舟曲县城@@ZQXC
连夜@@LY

两个词。我如果加入一些词语如:

圣元

与时俱进

则能够将该这类词语分词。

ICTCLAS Init Fail 问题

问题1:ICTCLAS 2011 java 版本当调用次数增加时候就会导致内存不够而加载失败(Init Fail!)。我调用了300来次没有出问题,都是当调用500次以上时候就出现Init Fail!。在ICTCLAS bbs上一位朋友也遇到类似问题,解决办法是可以使用 开源的java包 或者ICTCLAS 2009(可以在官方网站上找到旧的版本).

问题2:ICTCLAS以前一直运行正常,但是过了一段时间,如半年后,出现init failed,是因为license 过期。重新下载替换ICTCLAS.dll(ICTCLAS30/50.dll)即可。

Eclipse中ICTCLAS 2011 的java调用相关推荐

  1. java eclipse profile_在 Eclipse 中集成JProfiler 进行 JAVA 项目性能分析

    1.双击安装 2.选择路径 默认路径:Install into:C:\Program Files\jprofiler11 自定义:Customize installation 选择完成后点击 next ...

  2. 在eclipse中指定启动时java的位置

    最近使用Mac,在第一次安装好jdk以后eclipse可以直接运行,在终端中也可以使用java命令.出于种种原因,把java的各个文件夹都删除了,然后再次安装jdk. 此时,在终端中不能识别java命 ...

  3. Eclipse中使用Gradle构建Java Web项目

    Gradle是一种自动化建构工具,使用DSL来声明项目设置.通过Gradle,可以对项目的依赖进行配置,并且自动下载所依赖的文件,使得构建项目的效率大大提高. 1. 安装Gradle 下载Gradle ...

  4. xml生成java代码_在Eclipse中从XML生成Java代码

    这正是模型到文本(M2T)项目中的JET组件的用途.实际上,您甚至可以使用JET创建项目,.classpath和任何其他文件. Jet模板如下.请注意,这些模板必须完全按照所示命名. /templat ...

  5. 如何在Eclipse中查看JDK以及JAVA框架的源码(转载)

    原文链接:http://www.cnblogs.com/outlooking/p/5243415.html 设置步骤如下: 1.点 "window"-> "Pref ...

  6. 关于Eclipse中各个文件(*.java *.jsp *.xml)文字大小的设定。

    对于java文件,文字大小的设置,应该都没有问题. 窗口---->首选项----->General ------>Appearnce (外観) ----->Colors and ...

  7. eclipse中要让一个 Java 源文件打开时编码格式为 UTF-8

    1)设置Java 源文件的默认编码格式为UTF-8: 2)设置workspace的编码格式为UTF-8.  相应设置如下:         设置 Java 源文件的默认编码格式为 UTF-8      ...

  8. eclipse中没有run as java application

    写了一个简单的java程序,run as的时候发现没有没有java application.如下图所示: 经检查发现是class中main拼写错误,改正即可. 总结:run as中没有java app ...

  9. eclipse中使用javap分析java代码备忘

    在run中打开external tools configurations,配置如下运行就行. 转载于:https://www.cnblogs.com/mapleyuan/archive/2013/04 ...

最新文章

  1. 从某次测试过程中,得到的MySQL性能优化的建议,和定位问题的方法
  2. linux之使用帮助
  3. Zuul使用正则表达式指定路由规则
  4. mysql 2005开发版,SQL server 2019 开发版下载
  5. 在plist文件中增删改查
  6. python字典数据类型笔记_python笔记2-数据类型:元组、字典常用操作
  7. 哔哩哔哩中缓存的视频和音频如何合并
  8. imageJ如何在视频每一帧中添加text
  9. new Date()时间格式转时间戳在苹果机iOS上无效
  10. php 多个一维数组合拼成二维数组的方法
  11. matlab实践总结与体会,MatLab实习心得体会
  12. html浏览器兼容性问题总结,常见的浏览器兼容性问题(小结)
  13. [Swift通天遁地]七、数据与安全-(6)管理文件夹和创建并操作文件
  14. sql面试题(学生表_课程表_成绩表_教师表)
  15. 如何当好硬软件助理工程师——实习周报(一)
  16. anaconda常用命令
  17. 从优步僵尸车事件看源码保护的必要性
  18. android 地铁地图api,百度地铁图JS API使用
  19. 四种电子取证软件的比较
  20. springboot-java常用注解

热门文章

  1. Python dict set
  2. OpenCV中的reshape
  3. 问题三十七:C++怎么解一元四次方程?(2)——怎么解一元三次方程
  4. 8种排序算法 java_必须知道的八大种排序算法【java实现】
  5. TypeScript算法专题 - [双链表1] - 双链的概念及其实现
  6. react classname多个_React全家桶简介
  7. ios 去掉底部状态栏,隐藏ios 9中的状态栏
  8. AcWing 1750. 救生员(差分+暴力枚举)
  9. C语言下取整下半个方括号,c语言易错知识点总结[工作范文](28页)-原创力文档...
  10. java国际化软件_JavaWeb开发——软件国际化(动态元素国际化)