一、介绍

1、描述

      Apache OpenNLP库是一种基于机器学习的工具包,用于处理自然语言文本。它支持最常见的NLP任务,如标记化,句子分割,词性标记,命名实体提取,分块,解析和参考解析。 通常需要这些任务来构建更高级的文本处理服务。 OpenNLP还包括基于最大熵和感知器的机器学习。

      OpenNLP项目的目标是为上述任务创建一个成熟的工具包。 另一个目标是为各种语言提供大量预构建的模型,以及这些模型来自的注释文本资源。

2、结构

Apache OpenNLP库包含几个组件,使得能够构建一个完整的自然语言处理管道。 这些组件包括:句子检测器,分词器,名称查找器,文档分类器,词性标记器,chunker,解析器,参数解析。组件包含能够执行各自然语言处理任务,训练模型以及通常还用于评估模型的部分。 每个这些设施都可以通过其应用程序接口(API)访问。 此外,提供命令行界面(CLI)以方便实验和训练。

3、

1、)应用程序接口(API)。通用示例

     OpenNLP组件具有类似的API。 通常,要执行任务,应该提供一个模型和一个输入。

模型通常通过为模型类的构造函数提供一个FileInputStream模型来加载:

      InputStream modelIn = new FileInputStream("lang-model-name.bin");
      try {

            SomeModel model = new SomeModel(modelIn);

            }
      catch (IOException e) {
           //handle the exception
            }
      finally {
      if (null != modelIn) {
      try {
           modelIn.close();
           }
    catch (IOException e) {
          }
  }
}
       2、) 加载模型后,工具本身可以实例化。
      ToolName toolName = new ToolName(model);
       3、)在实例化工具之后,可以执行处理任务。输入和输出格式是特定于工具的,但通常输出是一个字符串数组,输入是字符串或字符串数组。
      String output[] = toolName.executeTask("This is a sample text.");

Apache OpenNLP介绍(一)相关推荐

  1. Apache OpenNLP提供的文档

    Apache OpenNLP提供了一个手册和Javadoc API文档. 本手册介绍了如何使用和培训各种OpenNLP组件. Apache OpenNLP 1.7.2文档 Apache OpenNLP ...

  2. Apache Spark 介绍的演讲ppt (slice),全英文

    这里是本人制作的Apache Spark 介绍的演讲ppt,全英文.这里粘贴部分截图,具体可到相应的链接下载ppt文件,ppt文件中有动画: 下载地址:https://download.csdn.ne ...

  3. Apache Tez介绍,术语,安装,监控等

    目录 1 Apache Tez 1 1.1 Apache Tez介绍 1 1.2 术语介绍 1 1.3 软件准备 2 1.4 设置tez-ui 3 1.4.1 找到war包 3 1.4.2 将tez- ...

  4. 《从0到1学习Flink》—— Apache Flink 介绍

    前言 Flink 是一种流式计算框架,为什么我会接触到 Flink 呢?因为我目前在负责的是监控平台的告警部分,负责采集到的监控数据会直接往 kafka 里塞,然后告警这边需要从 kafka topi ...

  5. 开源性能测试工具 - Apache ab 介绍

    开源性能测试工具 - Apache ab 介绍 简介 ab的全称是ApacheBench,是 Apache 附带的一个小工具,专门用于 HTTP Server 的benchmark testing,可 ...

  6. Apache Cordova介绍

    分享一下我老师大神的人工智能教程.零基础!通俗易懂!风趣幽默!还带黄段子!希望你也加入到我们人工智能的队伍中来!https://blog.csdn.net/jiangjunshow Apache Co ...

  7. Apache目录介绍

    Apache目录介绍 目录如下

  8. Apache OpenNLP

    Apache OpenNLP库是一种基于机器学习的工具包,用于处理自然语言文本. 它支持最常见的NLP任务,如标记化,句子分割,词性标记,命名实体提取,分块,解析和参考解析. 通常需要这些任务来构建更 ...

  9. Apache OpenNlp的初探

    Nlp:nature language processing.自然语言识别. 最近正好再做一个跟nlp有关的项目,正好就跟着了解了一下nlp的学习和使用以及原理. 先来说下使用.在这里笔者以在IDE中 ...

最新文章

  1. 深度学习将眼睛变成健康“指示器”
  2. sql 跟踪工具sql profiler使用
  3. linux修改网卡mac
  4. mysql join大小表顺讯_MySQL优化器join顺序
  5. win11 WSL Ubuntu更换为清华源
  6. 渗透测试入门11之一次完整的渗透测试实验
  7. javascript 中文帮助文档_我的《ANSA快速入门指南》中文帮助文档浅析(上)
  8. Halcon 基本算子释义
  9. sql string转换成int型 sql截取字符串
  10. yii2 联表查询时,查询关联表的字段时,使用asArray方法
  11. 计算机硬件维修书,计算机硬件维修手册
  12. java面试宝典及答案_最新Java面试宝典及答案
  13. 【刷题记录14】Java工程师丨腾讯面试真题(2)
  14. 8人Python-----day04
  15. Android 底层知识拾零,字节跳动Android高级工程师
  16. 7.9模拟比赛解题报告
  17. 遨博机器人执行线程_遨博机器人报错代码:If命令 if…else和条件选择命令Switch...Case...Default...
  18. 用HyperSnap实现滚屏抓取多屏网页
  19. win10系统打开文件出现安全警告窗口怎么关闭?
  20. web端拨打电话、发送短信

热门文章

  1. 一个关于jboss Halting VM的情况处理
  2. App逆向学习--1
  3. 《大西洋月刊》2014-2020年电子版合集| The Atlantic
  4. 标题标签<h1></h1>和段落标签<p>
  5. 智商情商哪个重要_情商和智商,到底哪个更重要?
  6. html如何使表单在页面居中显示,html怎样将表单居中
  7. 产品经理之toB项目各阶段工作内容详解
  8. matlab中删除照片_matlab中删除对象
  9. 韩顺平老师的linux基础课(复习笔记)
  10. 用在线工具processOn画UML的用例图和时序图