一、介绍

1、描述

Apache OpenNLP库是一种基于机器学习的工具包,用于处理自然语言文本。它支持最常见的NLP任务,如标记化,句子分割,词性标记,命名实体提取,分块,解析和参考解析。 通常需要这些任务来构建更高级的文本处理服务。 OpenNLP还包括基于最大熵和感知器的机器学习。

OpenNLP项目的目标是为上述任务创建一个成熟的工具包。 另一个目标是为各种语言提供大量预构建的模型,以及这些模型来自的注释文本资源。

2、结构

Apache OpenNLP库包含几个组件,使得能够构建一个完整的自然语言处理管道。 这些组件包括:句子检测器,分词器,名称查找器,文档分类器,词性标记器,chunker,解析器,参数解析。组件包含能够执行各自然语言处理任务,训练模型以及通常还用于评估模型的部分。 每个这些设施都可以通过其应用程序接口(API)访问。 此外,提供命令行界面(CLI)以方便实验和训练。

3、

1、)应用程序接口(API)。通用示例

OpenNLP组件具有类似的API。 通常,要执行任务,应该提供一个模型和一个输入。

模型通常通过为模型类的构造函数提供一个FileInputStream模型来加载:

 InputStream modelIn = new FileInputStream("lang-model-name.bin");
      try {

            SomeModel model = new SomeModel(modelIn);

            }
      catch (IOException e) {
           //handle the exception
            }
      finally {
      if (null != modelIn) {
      try {
           modelIn.close();
           }
    catch (IOException e) {
          }
  }
}

       2、) 加载模型后,工具本身可以实例化。

 ToolName toolName = new ToolName(model);

3、)在实例化工具之后,可以执行处理任务。输入和输出格式是特定于工具的,但通常输出是一个字符串数组,输入是字符串或字符串数组。

 String output[] = toolName.executeTask("This is a sample text.");

Apache opennlp简单介绍相关推荐

  1. 前端可视化组件库-Apache ECharts简单介绍vue框架使用eCharts例子

    eCharts是一个基于 JavaScript 的开源可视化图表库. 实现集成了前端可视化的多种手段. 官网链接:ECharts官网 初学者建议去官网看看起步的内容,另外博主也是今天刚学的噢,写得不好 ...

  2. Apache Zeppelin 简单介绍,以及下载地址

    https://zeppelin.apache.org Zeppelin 是一个提供交互数据分析且基于Web的笔记本. 方便你做出可数据驱动的.可交互且可协作的精美文档,并且支持多种语言,包括Scal ...

  3. Apache OpenNLP介绍(一)

    一.介绍 1.描述       Apache OpenNLP库是一种基于机器学习的工具包,用于处理自然语言文本.它支持最常见的NLP任务,如标记化,句子分割,词性标记,命名实体提取,分块,解析和参考解 ...

  4. 2021年大数据ELK(二):Elasticsearch简单介绍

    全网最详细的大数据ELK文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 一.Elasticsearch简介 1.介绍 2.创始人 二.E ...

  5. Django - Django框架 简单介绍

    Django框架 简单介绍 本文地址: http://blog.csdn.net/caroline_wendy/article/details/29172271 1. 介绍 Django是一个开放源码 ...

  6. Apache Hadoop 简单配置及实践

    http://archboy.org/2011/08/19/simple-apache-hadoop-setup-application-1/ Apache Hadoop 是一个分布式计算基础框架,通 ...

  7. hadoop简单介绍_Hadoop:简单介绍

    hadoop简单介绍 什么是Hadoop: Hadoop是用Java编写的框架,用于在大型商品硬件群集上运行应用程序,并具有类似于Google File System和MapReduce的功能 . H ...

  8. Hadoop:简单介绍

    什么是Hadoop: Hadoop是一种用Java编写的框架,用于在大型商品硬件集群上运行应用程序,并具有类似于Google File System和MapReduce的功能 . HDFS是高度容错的 ...

  9. ShardingSphere(一)ShardingSphere简单介绍及相关概念

    一.ShardingSphere简单介绍 出现背景:当数据库数据巨大时,数据库读写性能将变得很低,为了解决此问题,设计时,可以将数据进行分别存储于不同数据库.不同表中,以降低单表量数量大问题:Shar ...

  10. ActiveMQ此例简单介绍基于docker的activemq安装与集群搭建

    ActiveMQ拓展连接 此例简单介绍基于Docker的activemq安装与集群搭建 一 :安装 1.获取activemq镜像 docker pull webcenter/activemq 2.启动 ...

最新文章

  1. java哈夫曼编码与译码_哈夫曼编码与译码
  2. ubuntu18安装很慢_双硬盘装Win 10+Ubuntu 18.04双系统中的一些坑
  3. 通俗讲解自底向上构建知识图谱全过程
  4. 看Volley源码,对HTTP缓存机制分析
  5. win2008一键配置php mysql_Windows 2008一键安装包配置环境:Windows+IIS+Php+Mysql
  6. 【CodeForces - 546C 】Soldier and Cards (模拟)
  7. c语言树莓派音乐播放器,使用web端来控制我的树莓派播放音乐
  8. 中国移动携手华为完成5G话音的全部功能测试
  9. Mysql锁机制简单了解一下
  10. 计算机网络传媒介,2.3 网络传输媒介 - 第2章 计算机网络硬件基础 - 《计算机网络技术与应用》 - 倾心驿站 - 恰教程网...
  11. HDU 5285:wyh2000 and pupil
  12. android自定义通知栏样式,Android 通知栏自定义样式
  13. 医学生学计算机建议,医学生计算机能力的培养
  14. 考研最卷的专业,我们替你查到了!
  15. 《算法零基础100讲》(第20讲) 进制转换(二) - 进阶[C语言题解]
  16. 流式数据架构理论 ◆ 基本概念
  17. Handle的用法实例
  18. 传奇人物、NPC、怪物的头顶封号素材(顶戴花翎功能)添加教程
  19. Java 开源中文分词器Ansj 学习教程
  20. Python读写文件的推荐写法-try-open

热门文章

  1. 2018国内VR游戏现状
  2. 网站建设需遵循的六个步骤
  3. 全民一起玩Python 之 基础篇视频教程
  4. cmake 返回上层目录
  5. java 右下角_java实现桌面右下角弹窗效果
  6. 计算机热启动方法,关于电脑热启动的介绍
  7. websphere修改协议为TLS1.2
  8. php 实现人脸识别功能
  9. Exponential family: 指数分布族
  10. 实现简单QQ聊天功能