OpenNLP 命令行

1 安装

  • 下载
  • 下载地址:https://opennlp.apache.org/download.html;若下载历史版本,在 https://archive.apache.org/dist/opennlp/ 下载。
  • 下载完成后,解压到指定路径,例如我的路径为:E:\Software\NLP\apache-opennlp1.9.1
  • 环境变量配置
  • 新建变量,变量名和变量值分别为:
OPENNLP_HOMEE:\Software\NLP\apache-opennlp1.9.1
  • 在CLASSPATH变量后追加:
%OPENNLP_HOME%\lib;
  • 在Path后追加:
%OPENNLP_HOME%\bin;
  • 使用
    linux使用bin目录下的opennlp,windows使用opennlp.bat。
    栗子:如果当前命令行所在目录下有文档setence.txt,则该文档中的句子分词:

  linux

./opennlp SimpleTokenizer < sentences.txt

  windows

opennlp.bat SimpleTokenizer <sentences.txt

1.2 工具列表

LanguageDetector                 #语言检测
LanguageDetectorTrainer             #语言检测模型训练
LanguageDetectorConverter           #将莱比锡(leipzig)数据格式转换为本机OpenNLP格式
LanguageDetectorCrossValidator      #K-fold交叉验证器
LanguageDetectorEvaluator           #检测模型的效率DictionaryBuilder                   #穿件词典SentenceDetector                   #分句
SentenceDetectorTrainer
SentenceDetectorEvaluator
SentenceDetectorCrossValidator
SentenceDetectorConverterSimpleTokenizer                        #字符类分词
TokenizerME                         #分词
TokenizerTrainer                    #训练分词模型
TokenizerMEEvaluator
TokenizerCrossValidator
TokenizerConverter                  #将外国语言格式转换为本机OpenNLP格式
DictionaryDetokenizerTokenNameFinder                        #实体识别
TokenNameFinderTrainer
TokenNameFinderEvaluator
TokenNameFinderCrossValidator
TokenNameFinderConverter
CensusDictionaryCreator             #将1990年美国人口普查名称转换为字典Doccat                              #文档分类
DoccatTrainer
DoccatCrossValidator
DoccatConverter
POSTagger                           #词性标记
POSTaggerTrainer
POSTaggerEvaluator
POSTaggerCrossValidator
POSTaggerConverterLemmatizerME                      #指代消除
LemmatizerTrainerME
LemmatizerEvaluatorChunkerME                            #分块
ChunkerTrainerME
ChunkerEvaluator
ChunkerCrossValidator
ChunkerConverter                    #Parser                             #语法分析
ParserTrainer
ParserEvaluator
ParserConverter
BuildModelUpdater                   #训练、更新语法分析模型
CheckModelUpdater                   #训练、更新语法分析的检查模型
TaggerModelReplacer                 #替换语法分析模型EntityLinker                       #将实体链接到外部数据集NGramLanguageModel

1.3 使用详细说明

1.3.1 句子检测器
  • SentenceDetector
Usage: opennlp SentenceDetector model < sentencesArguments description:-model     模型-setences 要解析的文件

 栗子:

opennlp.bat SentenceDetector ch_sentence_detector.bin < sentences.txt > output.txt
  • SentenceDetectorTrainer
Usage: opennlp SentenceDetectorTrainer [.irishsentencebank|.ad|.pos|.conllx|.namefinder|.parse|.moses|.conllu|.letsmt] [-factory factoryName][-eosChars string][-abbDict path] [-params paramsFile] -lang language -model modelFile -data sampleData [-encoding charsetName] Arguments description:-factory factoryNameA sub-class of SentenceDetectorFactory where to get implementation and resources.-eosChars stringEOS characters.-abbDict pathabbreviation dictionary in XML format.-params paramsFiletraining parameters file.-lang languagelanguage which is being processed.-model modelFileoutput model file.-data sampleDatadata to be used, usually a file name.-encoding charsetNameencoding for reading and writing text, if absent the system default is used.

 栗子:

opennlp.bat SentenceDetectorTrainer -model ch_sentence_detector.bin -lang jpn -data ch_sentence_detector.train -encoding UTF-8

注:中文训练时,如果使用默认符号分句,则lang必须为jpn。

  • SentenceDetectorEvaluator
Usage: opennlp SentenceDetectorEvaluator[.nkjp|.irishsentencebank|.ad|.pos|.conllx|.namefinder|.parse|.moses|.conllu|.letsmt] -model model [-misclassified true|false]-data sampleData [-encoding charsetName]Arguments description:-model modelthe model file to be evaluated.-misclassified true|falseif true will print false negatives and false positives.-data sampleDatadata to be used, usually a file name.-encoding charsetNameencoding for reading and writing text, if absent the system default is used.

 栗子:

opennlp.bat SentenceDetectorEvaluator -model ch_sentence_detector.bin -misclassified true -data sentences.txt -encoding UTF-8

OpenNLP 命令行相关推荐

  1. ECS(Linux)连接RDS,使用命令行方式连接实例

    使用命令行方式连接实例 通过命令行连接RDS MySQL数据库,连接方式如下: mysql -h<连接地址> -P<端口> -u<用户名> -p -D<数据库 ...

  2. 从命令行到IDE,版本管理工具Git详解(远程仓库创建+命令行讲解+IDEA集成使用)

    首先,Git已经并不只是GitHub,而是所有基于Git的平台,只要在你的电脑上面下载了Git,你就可以通过Git去管理"基于Git的平台"上的代码,常用的平台有GitHub.Gi ...

  3. 基于Golang的CLI 命令行程序开发

    基于Golang的CLI 命令行程序开发 [阅读时间:约15分钟] 一. CLI 命令行程序概述 二. 系统环境&项目介绍&开发准备 1.系统环境 2.项目介绍 3.开发准备 三.具体 ...

  4. 简单解决用VS编写hello world时命令行一闪而过

    一.在return 0;前一行加一个getchar(); 二.使用项目模板为 windows 桌面向导 c++ 3.命令行控制台一闪而过.这是我们使用空文件夹加载的项目,默认不是控制台应用程序,新建控 ...

  5. java命令行读入密码_java-在命令行上隐藏输入

    是的,可以做. 这称为命令行输入屏蔽. 您可以轻松实现此目的. 您可以使用单独的线程擦除输入的回显字符,并用星号替换. 使用下面显示的EraserThread类完成此操作 import java.io ...

  6. Redis 笔记(16)— info 指令和命令行工具(查看内存、状态、客户端连接数、监控服务器、扫描大key、采样服务器、执行批量命令等)

    Info 命令返回关于 Redis 服务器的各种信息和统计数值.通过给定可选的参数 section ,可以让命令只返回某一部分的信息. 1. 显示模块 server : 一般 Redis 服务器信息, ...

  7. Linux shell 学习笔记(10)— 处理用户输入(命令行读取参数、读取用户输入、超时处理)

    1. 命令行参数 向 shell 脚本传递数据的最基本方法是使用命令行参数.命令行参数允许在运行脚本时向命令行添加数据. $ ./addem 10 30 本例向脚本 addem 传递了两个命令行参数( ...

  8. 命令行带参数启动--命令行相关问题 代码规范

    20210106 其实cmd和Linux一样可以通过特殊符号换行的: Linux 为 \ 而cmd 为 ^ 命令行换行符 20201127 options 代码编写变量意义 20200728 a.py ...

  9. 2021年大数据Hadoop(八):HDFS的Shell命令行使用

    2021大数据领域优质创作博客,带你从入门到精通,该博客每天更新,逐渐完善大数据各个知识体系的文章,帮助大家更高效学习. 有对大数据感兴趣的可以关注微信公众号:三帮大数据 目录 HDFS的Shell命 ...

  10. DOS命令行操作MySQL常用命令

    平时用可视化界面用惯了,如果紧急排查问题,没有安装可视化工具的话,只能通过命令来看了. 以备不时之需,我们要熟悉一下命令行操作MySQL. 打开DOS命令窗口:WIN + R 输入cmd,回车 然后输 ...

最新文章

  1. python安装scipy
  2. 业界资讯:Alternativa 3D 7 免费
  3. java case when用法_关于oracle case when的多种用法
  4. 【震惊】史上最牛的市场推广/营销
  5. 通过printf设置Linux终端输出的颜色和显示方式
  6. |NOIOJ|动态规划|3532:最大上升子序列和
  7. Nginx+FastCGI支持HTTPS部署过程详述
  8. swift3 按钮触发事件_swift5.3 UIView 与 UIButton 点击事件传递参数
  9. 清明节,如何用代码让网页变灰
  10. mac电脑开发环境配置
  11. Git学习(二)远程仓库建立与克隆
  12. 详解如何正确使用Tuxera NTFS For Mac软件
  13. java 强制转换double_JAVA强制类型转换
  14. SAP BAPI_SALESORDER_CREATEFROMDAT2 创建销售订单
  15. python发微信提醒天气_基于Python实现定时自动给微信好友发送天气预报
  16. 阿里P8整理Mysql面试题答案,助你面试“脱颖而出”
  17. 通信系统原理[郭宇春]——信号与噪声——课后习题答案
  18. CRM管理系统对企业有哪些好处?
  19. Stokes theorem
  20. Android 3D立体旋转效果实现

热门文章

  1. 准备配置windows 请勿关闭计算机 蓝屏,Win7开机总是出现提示“配置Windows请勿关机”...
  2. 计算机无法连接移动硬盘,移动硬盘无法访问怎么办 移动硬盘无法访问解决方法...
  3. Unity随机创造敌人
  4. 我们都应该停止三种测试实践
  5. SVN更新报the working copy needs to be upgraded解决办法
  6. 【练习】Building a Hypermedia-Driven RESTful Web Service
  7. 最流行的5个前端框架对比
  8. 【日记】python获取公众号的全部文章并截取图导出
  9. win10右键文件夹转圈卡死
  10. ISACA最新白皮书助力企业了解中国《个人信息保护法》