哈工大中文分词系统LTP(pyltp)学习笔记
一、LTP简介
介绍:语言技术平台(LTP) 提供包括中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注等丰富、高效、精准的自然语言处理技术。经过 哈工大社会计算与信息检索研究中心 11 年的持续研发和推广,LTP已经成为国内外最具影响力的中文处理基础平台,曾获 CoNLL 2009七国语言句法语义分析评测总成绩第一名,中文信息学会钱伟长一等奖等重要成绩和荣誉。目前,LTP 已经被 500多家国内外研究机构和企业使用,多家大企业和科研机构付费使用。
来源:语言云。
其他不做过多讲解,直接上官网。
二、附录
1、分词标注集
标记 | 含义 | 举例 |
---|---|---|
B | 词首 | __中__国 |
I | 词中 | 哈__工__大 |
E | 词尾 | 科__学__ |
S | 单字成词 | 的 |
2、词性标注集
因为这里手动加入表格太繁琐,所以我直接上图片。这里给大家说声对不起啦!!!
3、命名实体识别标注集
标记 | 含义 |
---|---|
O | 这个词不是NE |
S | 这个词单独构成一个NE |
B | 这个词为一个NE的开始 |
I | 这个词为一个NE的中间 |
E | 这个词位一个NE的结尾 |
LTP中的NE 模块识别三种NE,分别如下:
标记 | 含义 |
---|---|
Nh | 人名 |
Ni | 机构名 |
Ns | 地名 |
4、依存句法关系
嗯???
老样子,上图。再次给各位读者道歉!!!!
5、语义角色类型
嗯???
道???
歉???
其他的内容,先挖个坑,等学到了在更新这部分内容。
哈工大中文分词系统LTP(pyltp)学习笔记相关推荐
- 自然语言处理与中文分词的难点总结--学习笔记
自然语言处理与中文分词的难点总结 2012年7月2日 10:01 中文自动分词 指的是使用计算机自动对中文文本进行词语的切分,即像英文那样使得中文句子中的词之间有空格以标识.中文自动分词被认为是中文自 ...
- NLPIR(北理工张华平版中文分词系统)的SDK(C++)调用方法
一.本文内容简介 二.具体内容 1. 中文分词的基本概念 2.关于NLPIR(北理工张华平版中文分词系统)的基本情况 3.具体SDK模块(C++)的组装方式 ①准备内容: ②开始组装 三.注意事项 一 ...
- 基于Java实现的中文分词系统
资源下载地址:https://download.csdn.net/download/sheziqiong/85941192 资源下载地址:https://download.csdn.net/downl ...
- 系统架构师学习笔记_第六章(下)_连载
系统架构师学习笔记_第六章(下)_连载 6.3 基于 UML 的软件开发过程 6.3.1 开发过程概述 UML 是独立于软件开发过程的,能够在几乎任何一种软件开发过程中使用.迭代的渐进式软件开发过程 ...
- 13、《Libevent中文帮助文档》学习笔记13:Linux下集成、运行libevent
Linux下编译libevent的指导可以参考<4.<Libevent中文帮助文档>学习笔记4:Linux下编译libevent>,完成编译.安装,生成so库后,其他程序即可依 ...
- ictclas4j java_ictclas4j 中科院中文分词系统完成的java源码,能很好的实现 的 ,为文本挖掘提供基础。 Develop 238万源代码下载- www.pudn.com...
文件名称: ictclas4j下载 收藏√ [ 5 4 3 2 1 ] 开发工具: Java 文件大小: 6617 KB 上传时间: 2013-12-06 下载次数: 4 提 供 者: 黄倩 ...
- 四款python中文分词系统简单测试
四款python中文分词系统简单测试: 注:中科院分词可采用调用C库的方式使用 纠正下:中科院分词2012支持关键词提取 准确率测试(使用对应项目提供在线测试,未添加用户自定义词典) 结巴中文分词ht ...
- 基于HTTP协议的开源中文分词系统:HTTPCWS 1.0.0 发布
基于HTTP协议的开源中文分词系统:HTTPCWS 1.0.0 发布[原创] 发布版本: httpcws 1.0.0 (最新版本:2009-08-10发布) 程序网址:http://code.goog ...
- 几款开源的中文分词系统
以下介绍4款开源中文分词系统 python环境下,jieba也不错,实现词性分词性能据说不错. 1.ICTCLAS – 全球最受欢迎的汉语分词系统 中文词法分析是中文信息处理的基础与关键.中国科学院计 ...
- 免费中文分词系统与资源收集
转自:http://www.cnblogs.com/pittzh/articles/1677637.html 想要建立一个相对比较实用的"热点关键词库".主要功能就是收集关键和对关 ...
最新文章
- c#和python_IronPython和C#交互
- 【力荐】Exadata火线救援:10TB级数据修复经典案例详解!
- bootstrap 一排5个_9个非常实用的CSS图标库
- input在type=number时去右边上下箭头
- php软件开发--yii2框架搭建及gitlib同步线上网站
- vue 过滤器 filter
- 20175323 团队项目 服务器端函数功能与业务逻辑详解
- Jupyter Notebook使用
- stm32有源蜂鸣器程序,高效简洁优雅。
- 哪种软件测试硬盘速度,哪种工具最适合硬盘,SSD,U盘,存储卡速度性能测试?...
- linux未找到 ftp命令,Linux服务器ftp命令找不到
- wps两个表格对比数据(怎样对两个EXCEL表格数据对比,找出相同和不同的数据?)
- 基于51单片的电风扇系统
- 机器人庄园作文_关于周庄一日游作文六年级汇总5篇
- OA办公自动化系统作用
- html的nofollow、noindex标签
- 淘宝开源深度学习端侧推理引擎 MNN
- 一些关于ROS的讨论 Robot Operating System – A flexible framework for writing robot software (ros.org)
- Android-Glide使用
- 战网错误:我们在传输数据时遇到一个问题。保险起见,请先检查你的互联网连接之后再试一次!
热门文章
- 【数据库】数据库安全(授权,回收)
- android studio文件读写,Android 中的文件读写操作
- tomcat java.ext.dirs_tomcat classloader 加载class顺序
- k8s拉取harbor镜像_Kubernetes-连接Harbor仓库拉取镜像
- mysql查询一张表中一共有多少条数据
- 电商项目--使用GitHub进行版本管理,完美衔接idea详细流程,Java初阶知识点,完整步骤
- 户外lisp导向牌如何安装_他山之石可攻玉,赴成都、重庆学习考察户外广告和门头牌匾规划管理工作...
- sun oracle t4 2 功率,Oracle T4-2 使用ILOM CLI升级Firmware
- html框架设计左侧嵌套,html页面嵌套使用示例(frameset使用方法)
- apache iotdb_高性能轻体量物联网数据库Apache IoTDB