一、NLPIR是什么?

NLPIR(汉语分词系统)由中科大张华平博士团队开发,主要功能包括:中文分词,词性标注,命名实体识别,用户词典功能,详情见官网:http://ictclas.nlpir.org/。

二、java环境下的使用:

主要参考了如下资料:http://www.360doc.com/content/14/0926/15/19424404_412519063.shtml

下面是个人的使用方法,仅供参考

1、下载NLPIR工具包,链接如下:http://ictclas.nlpir.org/newsdownloads?DocId=389

工具包中主要包含了以下内容:(待补充)

2、NLPIR是在c、c++环境下的,所以在java环境下,得下载其提供的java接口, 所以我又下载了 windows 下64位的JNI 压缩包(根据自己机器环境下载):http://ictclas.nlpir.org/newsdownloads?DocId=353

所以现在有两个文件包:NLPIR工具包,JNI接口包。

3、现在可以开始构建自己的项目了:

(1)创建一个java 项目,最后形成的目录如下图:

其中:bai包中的是自己写的测试程序

Kevin.zhang是64位JNI压缩包中的内容,拷贝到自己创建的java项目中

file:为自己创建的目录,Data文件是来自NLPIR工具包

test:来自NLPIR工具包

NLPIR.dll 来自NLPIR工具包lib 目录中

NLPIR_JNI.dll来自JNI接口包

4、编写分词程序

代码如下:

packagebai;importkevin.zhang.NLPIR;public classnlpir_test {public static voidmain(String args[])

{try{

test();

}catch(Exception e)

{

e.printStackTrace();

}

}static void test()throwsException {//TODO Auto-generated method stub//这里就是("./file/")不用修改

NLPIR nlpir=newNLPIR();if(!NLPIR.NLPIR_Init("./file/".getBytes("UTF-8"),1))

{

System.out.println("NLPIR初始化失败");return;

}//句子分词测试

String temp="每天的日报都记得要发送, 以配合经理掌握项目的进度情况";byte[] resBytes=nlpir.NLPIR_ParagraphProcess(temp.getBytes("UTF-8"),0);

System.out.println("分词结果: "+new String(resBytes,"UTF-8"));//文件分词测试

String utf8File = "E:/wbjddata/user_product_similarity/product_vector_pro.txt";

String utf8FileResult= "E:/wbjddata/user_product_similarity/product_vector_pro_seg_result.txt";

nlpir.NLPIR_FileProcess(utf8File.getBytes(), utf8FileResult.getBytes(),0);//退出, 释放资源

NLPIR.NLPIR_Exit();//nlpir.NLPIR_FileProcess,nlpir.NLPIR_ParagraphProcess中第二个参数0,表示只显示分词,不显示词性的标注

}

}

java nlpir_NLPIR分词工具的使用(java环境下)相关推荐

  1. java端分词工具ANSJ插件的基本使用

    前言: Java有11大开源中文分词器,分别是word分词器,Ansj分词器,Stanford分词器,FudanNLP分词器,Jieba分词器,Jcseg分词器,MMSeg4j分词器,IKAnalyz ...

  2. java 操作vss,java开发常用工具总结,java开发常用工具

    java开发常用工具总结,java开发常用工具 1.editplus editplus 是我使用最频繁的工具,不管是java程序还是其他的语言的程序,本人都使用它,方便好用,速度快.如果配置好的话,可 ...

  3. IBM内存分析工具JCA在windows环境下打开dump文件报错问题:Cannot find any thread dumps

    问题描述:IBM内存分析工具JCA在windows环境下打开dump文件报错问题:Cannot find any thread dumps 原因:dump文件编码格式问题 解决:修改dump.txt文 ...

  4. java中文分词工具_中文分词工具(LAC) 试用笔记

    一.背景 笔者2年前写过一篇<PHP使用elasticsearch搜索安装及分词方法>的文章,记录了使用ES的分词的实现步骤,最近又需要用到分词,在网上发现一个百度的中文分词项目,中文词法 ...

  5. java中文分词工具_中文分词常用方法简述

    中文分词 就是将一句话分解成一个词一个词,英文中可以用空格来做,而中文需要用一些技术来处理. 三类分词算法: 1. 基于字符串匹配: 将汉字串与词典中的词进行匹配,如果在词典中找到某个字符串,则识别出 ...

  6. java 开发人员工具_每个Java开发人员都应该知道的10个基本工具

    java 开发人员工具 大家好,我们已经到了2019年的第二个月,我相信你们所有人都已经制定了关于2019年学习以及如何实现这些目标的目标. 我一直在撰写一系列文章,为您提供一些知识,使您可以学习和改 ...

  7. 利用java虚拟机的工具jmap分析java内存情况

    2019独角兽企业重金招聘Python工程师标准>>> 有时候碰到性能问题,比如一个java application出现out of memory,出现内存泄漏的情况,再去修改bug ...

  8. java程序 开发工具_15款Java程序员必备的开发工具

    如果你是一名Web开发人员,那么用膝盖想也知道你的职业生涯大部分将使用Java而度过.这是一款商业级的编程语言,我们没有办法不接触它. 对于Java,有两种截然不同的观点:一种认为Java是最简单功能 ...

  9. java 反编译 在线_「java反编译工具」分享java反编译工具,超级好用 - seo实验室...

    java反编译工具 百度云盘链接:https://pan.baidu.com/s/1jxDQVwIqzFIjX13Av4bgCQ 文章最后发布于: 2018-11-19 16:58:27 相关阅读 在 ...

  10. Java反编译工具推荐 -- DJ Java Decompiler

    DJ Java Decompiler 是个反编译的工具,可以将编译过的 CLASS 文件编译还原成为 Java 原始文件,并且不需要额外安装 JVM(Java Virtual Machine)或是 J ...

最新文章

  1. python batch normalization_python – Keras BatchNormalization,样本明智规范化究竟是什么?...
  2. 科普丨深度学习硬件(GPU、FPGA、ASIC、DSP)
  3. lucene,基于QueryParser的搜索
  4. VTK:可视化之ExtrudePolyDataAlongLine
  5. 阿里云SAG2.0发布,助力企业全球互联
  6. 几个常见翻译引擎的不完全对比
  7. Android开源git40个App源码
  8. [java核心外篇]__Object类与对象类型的转型
  9. 报名啦!旷视研究院解读COCO 2017物体检测夺冠算法 | 吃瓜社
  10. Visual Studio 2019报错:缺少mfc120.dll
  11. python创建和删除文件有什么区别_python创建与删除临时文件夹的例子
  12. 【粉丝福利】Logo评选投票,礼品赠送!
  13. 使用rust调用c++静态库并编译nodejs包
  14. SPSS 25.0中文版安装教程【001期】
  15. html标签加载状态,如何让html页面数据没有加载完前显示loading加载中
  16. 高德地图 天气java_高德地图API获取天气
  17. ubuntu下公式编辑器EqualX的安装和使用
  18. 三菱M80操作介绍_三菱PLC电脑上仿真操作步骤
  19. 前端实习工作找不到,怎么增长实战经验
  20. 怎么把一张普通照片变成一寸照?这个小技巧了解一下

热门文章

  1. 一张图了解软件测试流程
  2. 调用java webservice 报错_java调用webservice方法报错
  3. ffmpeg mp4视频流解码
  4. java的class文件在哪里_传统上,你在哪里存储Java .class文件?
  5. 强行进入加密QQ空间
  6. 我的第一个游戏FoodieThebug完成之后的心得体会--子龙山人
  7. 从零开发区块链应用(一)--golang配置文件管理工具viper
  8. Ant Design Upload 文件上传功能
  9. gis地图php,中国地图矢量gis数据
  10. lomboz 官方网址