nlpir语义分析 java_集成nlpir语义分析
集成nlpir语义分析
Java 集成 NLPIR 语义分析系统1 简介NLPIR 是一套专门针对原始文本集进行处理和加工的软件,提供了中间件处理效果的可视化展示,也可以作为小规模数据的处理加工工具。用户可以使用该软件对自己的数据进行处理。NLPIR 分词系统前身为 2000 年发布的 ICTCLAS 词法分析系统,从 2009 年开始,为了和以前工作进行大的区隔,并推广 NLPIR 自然语言处理与信息检索共享平台,调整命名为NLPIR 分词系统。NLPIR 系统支持多种编码( GBK 编码、UTF8 编码、 BIG5 编码) 、多种操作系统(Windows, Linux, FreeBSD 等所有主流操作系统) 、多种开发语言与平台(包括:C/C++/C#,Java,Python,Hadoop 等) 。本文中,我们讨论 NLPIR 与 Java Web 项目的集成使用。2 源码下载 URL 地址可以下载整个的 NLPIR 项目,如果要下载某一单独部分,比如 summary(摘要) ,在下载时需要用 TortoiseSVN 工具,在 check out 里输入地址: tree/master 换成 trunk,下载。3 与 web 项目集成web 项目的搭建与配置在这里不在累述。NLPIR2016 版本可以使用配置文件配置需要读取的 dll 路径使用配置文件时,代码中初始化接口时需要修改读取 dll 文件的路径。如:图中的 nlpirpathString 需要读取 dll_or_so_path 来获得(避免又用配置文件,有放 dll 到tomcat bin 目录下的问题)如果不用配置文件,则需要把用到的 dll 放到 tomcat 的 bin 目录下。我们以提取文本摘要为例,讲一下集成 NLPIR。3.1 加入 jar 包pom.xml 里加入 jna 包的引用3.2 拷贝 Data 和 win64 两个文件夹把下载的源码中 Data 和 win64 两个文件夹拷贝到 tomcat 的 bin 目录下3.3 拷贝代码拷贝 src 下的文件到项目下,修改包路径3.4 对方法进行简单封装ClibraryDS.java 类的代码如下,我把初始化接口的静态变量放到了自己的测试类中package com.springmvc.nlpir.summary.lingjoin.summary;import com.sun.jna.Library;/*** 生成摘要的组件,该组件可以自定义摘要的长度* @author lingjoin_zyp**/public interface CLibraryDS extends Library {// 定义并初始化接口的静态变量/*** 功能:初始化* @param sPath Data目录的父目录,可以直接传入 ““来表示寻找项目下的Data 目录* @param nEncoding 设置分词编码,只能处理相应初始编码的文件. 默认为GBK。* 0:GBK;1:UTF- 8;2:BIG5;3:GBK_FANTI* @param sLicenseCode 授权码,这里直接用“0“,就可以了* @return true - 成功; false - 失败* 备注:在进程中此函数必须在其他函数之前调用(只需执行一次)*/public boolean DS_Init(String sPath, int nEncoding, String sLicenseCode);/*** 功能:生成单文档摘要* @param sText 文档内容* @param fSumRate 文档摘要占原文百分比,该值最大不能超过1.00* @param iSumLen 用户限定的摘要长度 * @param bHtmlTagRemove-[IN] 是否需要对原文进行 Html标签的去除* @return* 备注: fSumRate和iSumLen这个两个参数设置一个就可以了,例如:* DS_SingleDoc(sText, 0.00f, 80);* DS_SingleDoc(sText, 0.50f, 0);*/public String DS_SingleDoc(String sText, float fSumRate, int iSumLen, boolean bHtmlTagRemove);/*** 退出,释放资源;进程结束前须调用它释放所占用的内存资源* 备注:如果需要频繁的生成摘要,那么不要调用这个方法*/public void DS_Exit();/*** 获得错误消息* @return 错误消息* 备注:如果初始化失败,可以用该方法输出初始化失败原因*/public String DS_GetLastErrMsg();}新建一个测试类,封装接口方法package com.springmvc.nlpir.impl;import java.math.BigDecimal;import com.springmvc.nlpir.keyword.CLibrary;import com.springmvc.nlpir.summary.lingjoin.deepClassify.DeepClassifierLibrary;import com.springmvc.nlpir.summary.lingjoin.fileutil.OSinfo;import com.springmvc.nlpir.summary.lingjoin.summary.CLibraryDS;import com.springmvc.utils.DoProperties;import com.sun.jna.Native;public class MyTest {private CLibrary instance;private CLibraryDS dsInstance;private DeepClassifierLibrary dcInstance;public MyTest(){CLibraryDS dsInstance = (CLibraryDS) Native.loadLibrary(OSinfo.getSysAndBit(“LJSummary“), CLibraryDS.class);boolean flag = dsInstance.DS_Init(““, 1, “0“);if (flag == false) {// 如果初始化失败,就打印出失败原因System.out.println(dsInstance.DS_GetLastErrMsg());}String nlpirpathString = DoProperties.properties.getProperty(“dll_or_so_path“);nlpirpathString = nlpirpathString.substring(0, nlpi
nlpir语义分析 java_集成nlpir语义分析相关推荐
- 今日 Paper | 多人姿势估计;对话框语义分析;无监督语义分析;自然语言处理工具包等
导语:为了更好地服务广大 AI 青年,AI 研习社正式推出全新「论文」版块 目录 基于层次表示的面向任务对话框语义分析 固定的无监督语义分析 斯坦福CoreNLP自然语言处理工具包 DeepCut ...
- mysql 语义分析_情感和语义分析最全中文数据库
[实例简介] 最全的中文情感和语义词典,文件内容(TXT和excel)如下: 1. 褒贬词及其近义词: 2. 汉语情感词极值表: 3. 清华大学李军中文褒贬义词典: 4. 情感词典及其分类: 5. 情 ...
- 语义分析程序 c语言,语义分析的C语言代码
之前写了12篇使用有限自动机(DFA)分析语法的文章,今天说一下语义分析. 怎么用C语言写语法分析3,基于有限自动机的表达式分析 怎么用C语言写语法分析 用C语言实现一个真正的词法分析器 语义分析,也 ...
- consul java_集成Consul负载均衡多实例注册_java_天雨流芳-CSDN博客
原理 问题:问题在多个实例注册时出现.如果不解决将会出现实例覆盖的情况,实现不了负载均衡. 原因:根据官网描述:Consul 的注册机制,默认是Spring Cloud Consul在注册的时候实例名 ...
- app分发平台java_集成 Asset Delivery (Java)
您可以按照本指南中的步骤,从 Java 代码获取应用的资源包.如果您尚未使用 Asset Pack 构建 app bundle,请参阅针对原生代码或 Java 代码构建后再继续. 概览 Play Co ...
- 乱码ictclas java_中科院分词系统(NLPIR)JAVA简易教程
这篇文档内容主要从官方文档中获取而来,对API进行了翻译,并依据个人使用经验进行了一些补充,鉴于能力有限.水平较低,文档中肯定存在有很多不足之处,还请见谅. 下载地址:http://ictclas.n ...
- NLP知识包--语义分析智能问答工具
关于语义分析.智能问答的发展和技术介绍,以及语义分析工具的总结 概念 语义分析 语义分析(Semantic Analysis)指运用各种机器学习方法,学习与理解一段文本所表 示的语义内容. 一段文本通 ...
- 使用NLPIR 进行中文分词并标注词性
背景 在许多时候为了更好的解析文本,我们不仅仅需要将文本分词,去停这么简单,除了获取关键词与新词汇以外,我们还需要对获取每个粒度的其他信息,比如词性标注,在python中NLPIR就可以很好的完成这个 ...
- 中科院分词系统(NLPIR)JAVA简易教程
这篇文档内容主要从官方文档中获取而来,对API进行了翻译,并依据个人使用经验进行了一些补充,鉴于能力有限.水平较低,文档中肯定存在有很多不足之处,还请见谅. 下载地址:http://ictclas.n ...
- 潜在语义分析对认知科学的启示
潜在语义分析技术对认知科学以及虚拟现实系统的设计也具有启示: 首先,由于LSA可以用数学方法实现对文本的理解,所以可采用LSA分析人对文本的理解. 认知领域中,文本理解研究的主要目标是发现影响读者由文 ...
最新文章
- magento本地安装成功后无法进入后台,密码和用户名均正确 .
- BZOJ 1226: [SDOI2009]学校食堂Dining [DP 状压]
- nginx 同一个IP上配置多个HTTPS主机
- html5清除手机页面缓存文件夹,WebView自动缓存-清除缓存
- halcon 将数据保存到excel_pandas筛选、合并、批量保存excel数据
- 正式环境docker部署hyperf_使用docker搭建hyperf环境连接mysql
- CCF 201503-2 数字排序
- opencv3.1.0+VS2013 环境配置
- 使用Angularjs的ng-cloak指令避免页面乱码
- 码云webhook php,PHP实现码云Gitee的WebHook密钥验证算法
- JS判断不同的浏览器和版本,提示浏览器版本过低,兼容IE8到IE11
- NanoPC T4 移植 HPSocket
- python开发板卡驱动开发_IC卡驱动程序开发
- Ubuntu安装VMware Tools后不起作用
- FME中WorkspaceRunner传参处理
- MySQL 简单查询记录(二)
- 数学在计算机密码学中的运用,数学在密码学中的应用浅析
- 富士康用机器人取代了6万个工人
- 达人评测 雷神911mr怎么样
- 1.华为设备CPU过高排查过程