Eclipse中ICTCLAS 2011 的java调用
http://hi.baidu.com/tanzhangwen/item/ab7c0909699546dddce5b006
本文由twenz整理。
以前ICTCLAS官方网站上并没有官方的java版本,只有一些爱好者根据c++改写的几个java版本供下载。2011/2009则提供了官方的java调用版本,但分词程序的实现应该还是基于c++的dll文件,只是提供了java的借口。下面简要介绍eclipse中使用ICTCLAS2011的简要步骤:
1. 下载最新版的分词开源软件ICTCLAS的java版(Windows)
ICTCLAS2011_Windows_32_jni
http://ictclas.org/ictclas_download.asp
2. 将ICTCLAS加入到工程中
下载的ICTCLAS50_Windows_32_JNI.rar\Sample\ictclas_sample_java解压到所建立的java工程中,如果工程中代码是放在src文件中的话,则可以把解压后的ICTCLAS文件夹拷贝到src源码文件夹中去
3. 运行分词软件ICTCLAS
将解压后的文件TestMain.java复制到工程的源码中去,即可以运行并分词。
4. 添加用户自定义的词典
由于提供的词典的词的数量不多,如“与时俱进”这一成语都不能分好,另外一些领域的词也没有,这样需要我们在用户词典中添加我们需要的词语。在解压的文件中有一个userdict.txt的文件,可以加入一些用户自定义的词语用作分词的词典。文件中有:
舟曲县城@@ZQXC
连夜@@LY
两个词。我如果加入一些词语如:
圣元
与时俱进
则能够将该这类词语分词。
ICTCLAS Init Fail 问题
问题1:ICTCLAS 2011 java 版本当调用次数增加时候就会导致内存不够而加载失败(Init Fail!)。我调用了300来次没有出问题,都是当调用500次以上时候就出现Init Fail!。在ICTCLAS bbs上一位朋友也遇到类似问题,解决办法是可以使用 开源的java包 或者ICTCLAS 2009(可以在官方网站上找到旧的版本).
问题2:ICTCLAS以前一直运行正常,但是过了一段时间,如半年后,出现init failed,是因为license 过期。重新下载替换ICTCLAS.dll(ICTCLAS30/50.dll)即可。
Eclipse中ICTCLAS 2011 的java调用相关推荐
- java eclipse profile_在 Eclipse 中集成JProfiler 进行 JAVA 项目性能分析
1.双击安装 2.选择路径 默认路径:Install into:C:\Program Files\jprofiler11 自定义:Customize installation 选择完成后点击 next ...
- 在eclipse中指定启动时java的位置
最近使用Mac,在第一次安装好jdk以后eclipse可以直接运行,在终端中也可以使用java命令.出于种种原因,把java的各个文件夹都删除了,然后再次安装jdk. 此时,在终端中不能识别java命 ...
- Eclipse中使用Gradle构建Java Web项目
Gradle是一种自动化建构工具,使用DSL来声明项目设置.通过Gradle,可以对项目的依赖进行配置,并且自动下载所依赖的文件,使得构建项目的效率大大提高. 1. 安装Gradle 下载Gradle ...
- xml生成java代码_在Eclipse中从XML生成Java代码
这正是模型到文本(M2T)项目中的JET组件的用途.实际上,您甚至可以使用JET创建项目,.classpath和任何其他文件. Jet模板如下.请注意,这些模板必须完全按照所示命名. /templat ...
- 如何在Eclipse中查看JDK以及JAVA框架的源码(转载)
原文链接:http://www.cnblogs.com/outlooking/p/5243415.html 设置步骤如下: 1.点 "window"-> "Pref ...
- 关于Eclipse中各个文件(*.java *.jsp *.xml)文字大小的设定。
对于java文件,文字大小的设置,应该都没有问题. 窗口---->首选项----->General ------>Appearnce (外観) ----->Colors and ...
- eclipse中要让一个 Java 源文件打开时编码格式为 UTF-8
1)设置Java 源文件的默认编码格式为UTF-8: 2)设置workspace的编码格式为UTF-8. 相应设置如下: 设置 Java 源文件的默认编码格式为 UTF-8 ...
- eclipse中没有run as java application
写了一个简单的java程序,run as的时候发现没有没有java application.如下图所示: 经检查发现是class中main拼写错误,改正即可. 总结:run as中没有java app ...
- eclipse中使用javap分析java代码备忘
在run中打开external tools configurations,配置如下运行就行. 转载于:https://www.cnblogs.com/mapleyuan/archive/2013/04 ...
最新文章
- 从某次测试过程中,得到的MySQL性能优化的建议,和定位问题的方法
- linux之使用帮助
- Zuul使用正则表达式指定路由规则
- mysql 2005开发版,SQL server 2019 开发版下载
- 在plist文件中增删改查
- python字典数据类型笔记_python笔记2-数据类型:元组、字典常用操作
- 哔哩哔哩中缓存的视频和音频如何合并
- imageJ如何在视频每一帧中添加text
- new Date()时间格式转时间戳在苹果机iOS上无效
- php 多个一维数组合拼成二维数组的方法
- matlab实践总结与体会,MatLab实习心得体会
- html浏览器兼容性问题总结,常见的浏览器兼容性问题(小结)
- [Swift通天遁地]七、数据与安全-(6)管理文件夹和创建并操作文件
- sql面试题(学生表_课程表_成绩表_教师表)
- 如何当好硬软件助理工程师——实习周报(一)
- anaconda常用命令
- 从优步僵尸车事件看源码保护的必要性
- android 地铁地图api,百度地铁图JS API使用
- 四种电子取证软件的比较
- springboot-java常用注解
热门文章
- Python dict set
- OpenCV中的reshape
- 问题三十七:C++怎么解一元四次方程?(2)——怎么解一元三次方程
- 8种排序算法 java_必须知道的八大种排序算法【java实现】
- TypeScript算法专题 - [双链表1] - 双链的概念及其实现
- react classname多个_React全家桶简介
- ios 去掉底部状态栏,隐藏ios 9中的状态栏
- AcWing 1750. 救生员(差分+暴力枚举)
- C语言下取整下半个方括号,c语言易错知识点总结[工作范文](28页)-原创力文档...
- java国际化软件_JavaWeb开发——软件国际化(动态元素国际化)