Apache opennlp简单介绍
一、介绍
1、描述
Apache OpenNLP库是一种基于机器学习的工具包,用于处理自然语言文本。它支持最常见的NLP任务,如标记化,句子分割,词性标记,命名实体提取,分块,解析和参考解析。 通常需要这些任务来构建更高级的文本处理服务。 OpenNLP还包括基于最大熵和感知器的机器学习。
OpenNLP项目的目标是为上述任务创建一个成熟的工具包。 另一个目标是为各种语言提供大量预构建的模型,以及这些模型来自的注释文本资源。
2、结构
Apache OpenNLP库包含几个组件,使得能够构建一个完整的自然语言处理管道。 这些组件包括:句子检测器,分词器,名称查找器,文档分类器,词性标记器,chunker,解析器,参数解析。组件包含能够执行各自然语言处理任务,训练模型以及通常还用于评估模型的部分。 每个这些设施都可以通过其应用程序接口(API)访问。 此外,提供命令行界面(CLI)以方便实验和训练。
3、
1、)应用程序接口(API)。通用示例
OpenNLP组件具有类似的API。 通常,要执行任务,应该提供一个模型和一个输入。
模型通常通过为模型类的构造函数提供一个FileInputStream模型来加载:
InputStream modelIn = new FileInputStream("lang-model-name.bin");
try {
SomeModel model = new SomeModel(modelIn);
}
catch (IOException e) {
//handle the exception
}
finally {
if (null != modelIn) {
try {
modelIn.close();
}
catch (IOException e) {
}
}
}
2、) 加载模型后,工具本身可以实例化。
ToolName toolName = new ToolName(model);
3、)在实例化工具之后,可以执行处理任务。输入和输出格式是特定于工具的,但通常输出是一个字符串数组,输入是字符串或字符串数组。
String output[] = toolName.executeTask("This is a sample text.");
Apache opennlp简单介绍相关推荐
- 前端可视化组件库-Apache ECharts简单介绍vue框架使用eCharts例子
eCharts是一个基于 JavaScript 的开源可视化图表库. 实现集成了前端可视化的多种手段. 官网链接:ECharts官网 初学者建议去官网看看起步的内容,另外博主也是今天刚学的噢,写得不好 ...
- Apache Zeppelin 简单介绍,以及下载地址
https://zeppelin.apache.org Zeppelin 是一个提供交互数据分析且基于Web的笔记本. 方便你做出可数据驱动的.可交互且可协作的精美文档,并且支持多种语言,包括Scal ...
- Apache OpenNLP介绍(一)
一.介绍 1.描述 Apache OpenNLP库是一种基于机器学习的工具包,用于处理自然语言文本.它支持最常见的NLP任务,如标记化,句子分割,词性标记,命名实体提取,分块,解析和参考解 ...
- 2021年大数据ELK(二):Elasticsearch简单介绍
全网最详细的大数据ELK文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 一.Elasticsearch简介 1.介绍 2.创始人 二.E ...
- Django - Django框架 简单介绍
Django框架 简单介绍 本文地址: http://blog.csdn.net/caroline_wendy/article/details/29172271 1. 介绍 Django是一个开放源码 ...
- Apache Hadoop 简单配置及实践
http://archboy.org/2011/08/19/simple-apache-hadoop-setup-application-1/ Apache Hadoop 是一个分布式计算基础框架,通 ...
- hadoop简单介绍_Hadoop:简单介绍
hadoop简单介绍 什么是Hadoop: Hadoop是用Java编写的框架,用于在大型商品硬件群集上运行应用程序,并具有类似于Google File System和MapReduce的功能 . H ...
- Hadoop:简单介绍
什么是Hadoop: Hadoop是一种用Java编写的框架,用于在大型商品硬件集群上运行应用程序,并具有类似于Google File System和MapReduce的功能 . HDFS是高度容错的 ...
- ShardingSphere(一)ShardingSphere简单介绍及相关概念
一.ShardingSphere简单介绍 出现背景:当数据库数据巨大时,数据库读写性能将变得很低,为了解决此问题,设计时,可以将数据进行分别存储于不同数据库.不同表中,以降低单表量数量大问题:Shar ...
- ActiveMQ此例简单介绍基于docker的activemq安装与集群搭建
ActiveMQ拓展连接 此例简单介绍基于Docker的activemq安装与集群搭建 一 :安装 1.获取activemq镜像 docker pull webcenter/activemq 2.启动 ...
最新文章
- java哈夫曼编码与译码_哈夫曼编码与译码
- ubuntu18安装很慢_双硬盘装Win 10+Ubuntu 18.04双系统中的一些坑
- 通俗讲解自底向上构建知识图谱全过程
- 看Volley源码,对HTTP缓存机制分析
- win2008一键配置php mysql_Windows 2008一键安装包配置环境:Windows+IIS+Php+Mysql
- 【CodeForces - 546C 】Soldier and Cards (模拟)
- c语言树莓派音乐播放器,使用web端来控制我的树莓派播放音乐
- 中国移动携手华为完成5G话音的全部功能测试
- Mysql锁机制简单了解一下
- 计算机网络传媒介,2.3 网络传输媒介 - 第2章 计算机网络硬件基础 - 《计算机网络技术与应用》 - 倾心驿站 - 恰教程网...
- HDU 5285:wyh2000 and pupil
- android自定义通知栏样式,Android 通知栏自定义样式
- 医学生学计算机建议,医学生计算机能力的培养
- 考研最卷的专业,我们替你查到了!
- 《算法零基础100讲》(第20讲) 进制转换(二) - 进阶[C语言题解]
- 流式数据架构理论 ◆ 基本概念
- Handle的用法实例
- 传奇人物、NPC、怪物的头顶封号素材(顶戴花翎功能)添加教程
- Java 开源中文分词器Ansj 学习教程
- Python读写文件的推荐写法-try-open