改动下ICTCLAS4J 0.9.1,简化代码并做了一个提高了性能的不死机的DOS 命令segtag.bat

ICTCLAS4J_0.9.1 是中科院张华平的分词系统的Java 版,改版作者Sinboy,发布在http://code.google.com/p/ictclas4j/, 我改动了一下几个地方

1. 对getNextElement采用建立临时索引的方式提高了几倍的分词速度
2. 注释了firstAdjust处的 index-- 和 index -= 2两句
3. 建立segtag.bat 方便处理文本文件

现在对一个文本文件分词, 运行下列命令即可
        segtag < input_corpus.txt > output_segtaged.txt

直接运行 segtag 
        那么自己输入语句,一回车就可以看到分词结果

4. 删除了使用Log4J的监控日志代码,删除了每一步骤耗用的时间信息输出,删除了图形界面代码,
只留下bin目录下的class文件,src目录下的Java 源代码,Data目录下的词典数据和SegTag.bat 简化了程序

下载可以在 http://groups.google.com/group/ictclas/web/ictclas4j.zip

改动下ICTCLAS4J 0.9.1 提供了分词速度相关推荐

  1. 三级数据库还是linux好,08年计算机三级数据库辅导:如何修改Linux下MySQL5.0的默认连接数...

    08年计算机三级数据库辅导:如何修改Linux下MySQL5.0的默认连接数 分类:计算机等级| 更新时间:2008-08-25| 来源:教育联展网 这段时间服务器崩溃2次,一直没有找到原因,今天看到 ...

  2. mysql8.0.13安装不_Windows环境下MySql8.0.13的安装及常见问题解决方案

    Windows环境下MySql8.0.13的安装及常见问题解决方案 目录 一.引文 二.下载地址 三.安装步骤 3.1.文件解压 3.2.新建并修改my.ini文件 3.3.配置环境变量 3.4.以管 ...

  3. 在数据增强、蒸馏剪枝下ERNIE3.0分类模型性能提升

    在数据增强.蒸馏剪枝下ERNIE3.0模型性能提升 项目链接: https://aistudio.baidu.com/aistudio/projectdetail/4436131?contributi ...

  4. iis6 fastcgiiis6 mysql php 2013_windows2003SP2下IIS6.0+FastCGI+PHP5.3+MySQL5.1+phpMyAdmin最详细图文配置教程...

    windows2003SP2下 IIS6.0+FastCGI+PHP5.3+MySQL5.1+Gzip PHP网站环境详细配置教程(菜鸟版) 2012.11.8 说明: 本帖是我经过一天一夜完成的,不 ...

  5. 分享如何在Ubuntu 16.04下CUDA8.0

    分享一篇在Ubuntu 16.04下CUDA8.0的安装过程的记录笔记. 1.安装驱动 最简单的安装方式是直接在"系统设置->软件和更新->附加驱动"中安装 这样的话, ...

  6. windows10下 tensorflow2.0 gpu 安装

    windows10下 tensorflow2.0 gpu 安装 安装显卡驱动. 确定python.cuda和cudnn对应的版本 安装cuda 安装cudnn 查看tensorflow的版本 impo ...

  7. linux 下 `dirname $0` 脚本文件放置的目录

    http://www.cnblogs.com/xupeizhi/archive/2013/02/19/2917644.html linux 下 `dirname $0` 在命令行状态下单纯执行 $ c ...

  8. Windows下 maven3.0.4的安装步骤+maven配置本地仓库(转载)

    转自:Windows下 maven3.0.4的安装步骤+maven配置本地仓库 简单讲下maven的安装步骤: 1.在安装maven之前,先确保已经安装JDK1.6及以上版本,并且配置好环境变量. 2 ...

  9. Ubuntu10.04下gFtp2.0.19 远程客户端中文乱码解决方法

    Ubuntu10.04下gFtp2.0.19 远程客户端中文乱码解决方法如下: 1.打开"gFTP-FTP-属性-常规-远程字符集": 2.将远程字符集设置为:gb2312,gbk ...

最新文章

  1. vue.js组件学习(上)
  2. codeup 1943进制转换
  3. html5做旋转太极图,HTML5 Canvas旋转动画的2个代码例子(一个旋转的太极图效果)...
  4. java 4种跟踪会话技术_会话跟踪技术
  5. Python实战之多线程编程thread模块
  6. java list转json
  7. Hadoop原理深度剖析系列1——Hadoop的基本知识
  8. bit加密的时候会格式化硬盘吗_硬件百科:能在移动SSD上装系统吗?
  9. html的canvas代码,HTML
  10. 微信小程序保存图片到相册
  11. win11安装texlive 2021版本
  12. ARouter路由简单使用以及源码解析
  13. nginx gzip
  14. FFMPEG开发之——视频转码
  15. 特殊符号html怎么打出来的,特殊符号怎么打出来
  16. 体验灵魂出窍:错觉延伸人体对自身感觉
  17. 2017“硅谷技划”日记之五:从组织者眼光看Google IO大会
  18. 双向可控硅实现 插头防插拔火花
  19. Android 动态修改app名称(市场和手机中显示两个不同的名称)
  20. 【智慧照明】宾馆智能照明控制系统

热门文章

  1. 虚拟桌面最佳组合---Windows 7
  2. 关于Unity中物理检测的准备
  3. 局域网常见***与如何防范讲解【14集】
  4. 云计算与虚拟化以及IaaS, PaaS和SaaS
  5. 自定义webpart显示Lync状态球
  6. 如何通过cpuinfo信息查看几个物理cpu,几个核数,几线程
  7. Spring Aop实例
  8. Android 数据库框架ormlite 使用精要
  9. golang中utf8和汉字互转
  10. 袁隆平院士在湖南农业大学新生典礼上的致辞