集成nlpir语义分析

Java 集成 NLPIR 语义分析系统1 简介NLPIR 是一套专门针对原始文本集进行处理和加工的软件,提供了中间件处理效果的可视化展示,也可以作为小规模数据的处理加工工具。用户可以使用该软件对自己的数据进行处理。NLPIR 分词系统前身为 2000 年发布的 ICTCLAS 词法分析系统,从 2009 年开始,为了和以前工作进行大的区隔,并推广 NLPIR 自然语言处理与信息检索共享平台,调整命名为NLPIR 分词系统。NLPIR 系统支持多种编码( GBK 编码、UTF8 编码、 BIG5 编码) 、多种操作系统(Windows, Linux, FreeBSD 等所有主流操作系统) 、多种开发语言与平台(包括:C/C++/C#,Java,Python,Hadoop 等) 。本文中,我们讨论 NLPIR 与 Java Web 项目的集成使用。2 源码下载 URL 地址可以下载整个的 NLPIR 项目,如果要下载某一单独部分,比如 summary(摘要) ,在下载时需要用 TortoiseSVN 工具,在 check out 里输入地址: tree/master 换成 trunk,下载。3 与 web 项目集成web 项目的搭建与配置在这里不在累述。NLPIR2016 版本可以使用配置文件配置需要读取的 dll 路径使用配置文件时,代码中初始化接口时需要修改读取 dll 文件的路径。如:图中的 nlpirpathString 需要读取 dll_or_so_path 来获得(避免又用配置文件,有放 dll 到tomcat bin 目录下的问题)如果不用配置文件,则需要把用到的 dll 放到 tomcat 的 bin 目录下。我们以提取文本摘要为例,讲一下集成 NLPIR。3.1 加入 jar 包pom.xml 里加入 jna 包的引用3.2 拷贝 Data 和 win64 两个文件夹把下载的源码中 Data 和 win64 两个文件夹拷贝到 tomcat 的 bin 目录下3.3 拷贝代码拷贝 src 下的文件到项目下,修改包路径3.4 对方法进行简单封装ClibraryDS.java 类的代码如下,我把初始化接口的静态变量放到了自己的测试类中package com.springmvc.nlpir.summary.lingjoin.summary;import com.sun.jna.Library;/*** 生成摘要的组件,该组件可以自定义摘要的长度* @author lingjoin_zyp**/public interface CLibraryDS extends Library {// 定义并初始化接口的静态变量/*** 功能:初始化* @param sPath Data目录的父目录,可以直接传入 ““来表示寻找项目下的Data 目录* @param nEncoding 设置分词编码,只能处理相应初始编码的文件. 默认为GBK。* 0:GBK;1:UTF- 8;2:BIG5;3:GBK_FANTI* @param sLicenseCode 授权码,这里直接用“0“,就可以了* @return true - 成功; false - 失败* 备注:在进程中此函数必须在其他函数之前调用(只需执行一次)*/public boolean DS_Init(String sPath, int nEncoding, String sLicenseCode);/*** 功能:生成单文档摘要* @param sText 文档内容* @param fSumRate 文档摘要占原文百分比,该值最大不能超过1.00* @param iSumLen 用户限定的摘要长度 * @param bHtmlTagRemove-[IN] 是否需要对原文进行 Html标签的去除* @return* 备注: fSumRate和iSumLen这个两个参数设置一个就可以了,例如:* DS_SingleDoc(sText, 0.00f, 80);* DS_SingleDoc(sText, 0.50f, 0);*/public String DS_SingleDoc(String sText, float fSumRate, int iSumLen, boolean bHtmlTagRemove);/*** 退出,释放资源;进程结束前须调用它释放所占用的内存资源* 备注:如果需要频繁的生成摘要,那么不要调用这个方法*/public void DS_Exit();/*** 获得错误消息* @return 错误消息* 备注:如果初始化失败,可以用该方法输出初始化失败原因*/public String DS_GetLastErrMsg();}新建一个测试类,封装接口方法package com.springmvc.nlpir.impl;import java.math.BigDecimal;import com.springmvc.nlpir.keyword.CLibrary;import com.springmvc.nlpir.summary.lingjoin.deepClassify.DeepClassifierLibrary;import com.springmvc.nlpir.summary.lingjoin.fileutil.OSinfo;import com.springmvc.nlpir.summary.lingjoin.summary.CLibraryDS;import com.springmvc.utils.DoProperties;import com.sun.jna.Native;public class MyTest {private CLibrary instance;private CLibraryDS dsInstance;private DeepClassifierLibrary dcInstance;public MyTest(){CLibraryDS dsInstance = (CLibraryDS) Native.loadLibrary(OSinfo.getSysAndBit(“LJSummary“), CLibraryDS.class);boolean flag = dsInstance.DS_Init(““, 1, “0“);if (flag == false) {// 如果初始化失败,就打印出失败原因System.out.println(dsInstance.DS_GetLastErrMsg());}String nlpirpathString = DoProperties.properties.getProperty(“dll_or_so_path“);nlpirpathString = nlpirpathString.substring(0, nlpi

nlpir语义分析 java_集成nlpir语义分析相关推荐

  1. 今日 Paper | 多人姿势估计;对话框语义分析;无监督语义分析;自然语言处理工具包等

    导语:为了更好地服务广大 AI 青年,AI 研习社正式推出全新「论文」版块   目录 基于层次表示的面向任务对话框语义分析 固定的无监督语义分析 斯坦福CoreNLP自然语言处理工具包 DeepCut ...

  2. mysql 语义分析_情感和语义分析最全中文数据库

    [实例简介] 最全的中文情感和语义词典,文件内容(TXT和excel)如下: 1. 褒贬词及其近义词: 2. 汉语情感词极值表: 3. 清华大学李军中文褒贬义词典: 4. 情感词典及其分类: 5. 情 ...

  3. 语义分析程序 c语言,语义分析的C语言代码

    之前写了12篇使用有限自动机(DFA)分析语法的文章,今天说一下语义分析. 怎么用C语言写语法分析3,基于有限自动机的表达式分析 怎么用C语言写语法分析 用C语言实现一个真正的词法分析器 语义分析,也 ...

  4. consul java_集成Consul负载均衡多实例注册_java_天雨流芳-CSDN博客

    原理 问题:问题在多个实例注册时出现.如果不解决将会出现实例覆盖的情况,实现不了负载均衡. 原因:根据官网描述:Consul 的注册机制,默认是Spring Cloud Consul在注册的时候实例名 ...

  5. app分发平台java_集成 Asset Delivery (Java)

    您可以按照本指南中的步骤,从 Java 代码获取应用的资源包.如果您尚未使用 Asset Pack 构建 app bundle,请参阅针对原生代码或 Java 代码构建后再继续. 概览 Play Co ...

  6. 乱码ictclas java_中科院分词系统(NLPIR)JAVA简易教程

    这篇文档内容主要从官方文档中获取而来,对API进行了翻译,并依据个人使用经验进行了一些补充,鉴于能力有限.水平较低,文档中肯定存在有很多不足之处,还请见谅. 下载地址:http://ictclas.n ...

  7. NLP知识包--语义分析智能问答工具

    关于语义分析.智能问答的发展和技术介绍,以及语义分析工具的总结 概念 语义分析 语义分析(Semantic Analysis)指运用各种机器学习方法,学习与理解一段文本所表 示的语义内容. 一段文本通 ...

  8. 使用NLPIR 进行中文分词并标注词性

    背景 在许多时候为了更好的解析文本,我们不仅仅需要将文本分词,去停这么简单,除了获取关键词与新词汇以外,我们还需要对获取每个粒度的其他信息,比如词性标注,在python中NLPIR就可以很好的完成这个 ...

  9. 中科院分词系统(NLPIR)JAVA简易教程

    这篇文档内容主要从官方文档中获取而来,对API进行了翻译,并依据个人使用经验进行了一些补充,鉴于能力有限.水平较低,文档中肯定存在有很多不足之处,还请见谅. 下载地址:http://ictclas.n ...

  10. 潜在语义分析对认知科学的启示

    潜在语义分析技术对认知科学以及虚拟现实系统的设计也具有启示: 首先,由于LSA可以用数学方法实现对文本的理解,所以可采用LSA分析人对文本的理解. 认知领域中,文本理解研究的主要目标是发现影响读者由文 ...

最新文章

  1. magento本地安装成功后无法进入后台,密码和用户名均正确 .
  2. BZOJ 1226: [SDOI2009]学校食堂Dining [DP 状压]
  3. nginx 同一个IP上配置多个HTTPS主机
  4. html5清除手机页面缓存文件夹,WebView自动缓存-清除缓存
  5. halcon 将数据保存到excel_pandas筛选、合并、批量保存excel数据
  6. 正式环境docker部署hyperf_使用docker搭建hyperf环境连接mysql
  7. CCF 201503-2 数字排序
  8. opencv3.1.0+VS2013 环境配置
  9. 使用Angularjs的ng-cloak指令避免页面乱码
  10. 码云webhook php,PHP实现码云Gitee的WebHook密钥验证算法
  11. JS判断不同的浏览器和版本,提示浏览器版本过低,兼容IE8到IE11
  12. NanoPC T4 移植 HPSocket
  13. python开发板卡驱动开发_IC卡驱动程序开发
  14. Ubuntu安装VMware Tools后不起作用
  15. FME中WorkspaceRunner传参处理
  16. MySQL 简单查询记录(二)
  17. 数学在计算机密码学中的运用,数学在密码学中的应用浅析
  18. 富士康用机器人取代了6万个工人
  19. 达人评测 雷神911mr怎么样
  20. 1.华为设备CPU过高排查过程

热门文章

  1. VMware 15 安装 macOS High Sierra 10.13 图文教程
  2. 微信小程序实现当前页面多个视频文件只能播放一个视频,其他视频暂停,点击当前暂停当前
  3. 跨境电商o2o模式的表现形式有哪些?
  4. [AV1] Segment
  5. Hashtable的深拷贝
  6. 02、RabbitMQ之交换机
  7. font-spider压缩web font字体
  8. VB学习记录——数组
  9. DEVC艹如何设置初始的源码
  10. windows 截图软件——sharex 截图软件的天花板 并且是免费开源的。