版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/xuewenstudy/article/details/85028173
        命名实体识别(Named Entity Recognition,简称NER)用于识别文本中具有特定意义的实体。需要识别的实体可以分为三大类(实体类、时间类和数字类)和七小类(人名、机构名、地名、时间、日期、货币和百分比)。

本文介绍使用Ltp进行命名实体识别。

1、安装Ltp Python组件

(1)pyltp安装:

pip install pyltp

(不支持conda-python)

(2)部署语言模型库:

下载链接:http://ltp.ai/download.html

解压后如图所示

cws是中文分词模型,ner是命名实体识别模型,paeser是句法解析模型,pos是词性标注模型。

2、使用Ltp进行命名实体识别

(1)代码:

import sys
import os
from pyltp import *

sent = "欧洲 东部 的 罗马尼亚 , 首都 是 布加勒斯特 , 也 是 一 座 世界性 的 城市 。"
words = sent.split(" ")

postagger = Postagger()
postagger.load("D:\\Projects\\nlp\\ltp_data_v3.3.1\\pos.model")    #导入词性标注模块
postags = postagger.postag(words)

recognizer = NamedEntityRecognizer()
recognizer.load("D:\\Projects\\nlp\\ltp_data_v3.3.1\\ner.model")    #导入命名实体识别模块
netags = recognizer.recognize(words, postags)

for word,postag,netag in zip(words,postags,netags):
    print(word+'/'+postag+'/'+netag)

(2)运行结果:

词、词性、识别的专名用“ / ”分开了,“O”表示非专名,“S-Ns”表示地名。

参考文献:

郑捷,《NLP汉语自然语言处理原理与实践》
————————————————
版权声明:本文为CSDN博主「xuewenstudy」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/xuewenstudy/article/details/85028173

命名实体识别学习笔记——使用Ltp相关推荐

  1. 命名实体识别学习笔记

    1 命名实体识别概述 1.1 定义 命名实体识别(Name Entity Recognition,NER),也称作"专名识别",是指识别文本中具有特定意义的实体,包括人名.地名.机 ...

  2. 命名实体识别学习记录(spaCy/OpenNLP..)

    命名实体识别学习记录(spaCy/OpenNLP..) spaCy 环境 功能实现 NLTK 环境 功能实现 Stanford NLP 环境 功能实现 NER works Spacy Install ...

  3. 命名实体识别学习-用lstm+crf处理conll03数据集

    title: 命名实体识别学习-用lstm+crf处理conll03数据集 date: 2020-07-18 16:32:31 tags: 命名实体识别学习-用lstm+crf处理conll03数据集 ...

  4. 使用哈工大LTP进行文本命名实体识别并保存到txt

    版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/broccoli2/article/de ...

  5. 知识图谱学习笔记-命名实体识别

    一.命名实体识别简单概要 按照类型标记每一个名词:对句子名词进行分类 我今天(时间)要去北京(地点)参加面试 张三(人名)出生于上海(地名),清华大学(组织)毕业后去百度(组织)任职. 命名实体识别: ...

  6. 【论文笔记】命名实体识别论文

    其实实体识别这块看了挺久了的,今天就来好好聊一聊它.实体识别(Name Entity Recognition)是属于NLP任务中的序列标注问题:给定一个输入句子,要求为句子中的每一个token做实体标 ...

  7. 【论文笔记】《基于深度学习的中文命名实体识别研究》阅读笔记

    作者及其单位:北京邮电大学,张俊遥,2019年6月,硕士论文 摘要 实验数据:来源于网络公开的新闻文本数据:用随机欠采样和过采样的方法解决分类不均衡问题:使用BIO格式的标签识别5类命名实体,标注11 ...

  8. 实体对齐 算法_中英命名实体识别及对齐中的中文分词优化 论文笔记

    1.计算命名实体词汇对齐的置信度:对一个中英双语句对,中文在初始分词的基础上进行命名实体识别. 2.分词工具:采用中科院分词工具ICTCLAS.Stanford分词工具对中文句子进行分词,其中Stan ...

  9. 自然语言处理(NLP)之pyltp的介绍与使用(中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注)

    pyltp的简介   语言技术平台(LTP)经过哈工大社会计算与信息检索研究中心 11 年的持续研发和推广, 是国内外最具影响力的中文处理基础平台.它提供的功能包括中文分词.词性标注.命名实体识别.依 ...

最新文章

  1. 流程快速开发平台,工作流引擎中间件,工作质量考核设计
  2. 网页解析:如何获得网页源码中嵌套的标签。
  3. 最大权闭合 图 讲解
  4. java:LocalDate计算两个日期之间的天数
  5. java 链表反转_剑指BAT:如何最优雅着反转单链表?
  6. NetBeans 6.7.1、6.8界面美化
  7. 查看 SAP Spartacus 基于 Angular 的版本号
  8. shell编程追加2
  9. 图像标注,三倍加速:谷歌AI新方案,数据民工的福音 | Demo可玩耍
  10. fl2440hello world模块驱动编写
  11. oracle设置缓冲区大小设置,描述Oracle优化库高速缓冲区
  12. Window系统下搭建GIT本地服务器详细教程
  13. Java中的Socket是什么?
  14. 无敌python爬虫教程学习笔记(一)
  15. 计算机教室英语手抄报,关于教室的英语手抄报,英语手抄报简单又清楚?
  16. 海康威视错误代码说明
  17. 计算机无法连接到指定的服务器,无法连接Windows远程服务器的几种解决办法
  18. 功率谱密度的一个小理解
  19. 小程序电商对比传统电商的优势在哪?
  20. Prolog学习:用八卦的精神走进Prolog

热门文章

  1. 系统架构升级要不要上微服务?历“久”弥新微服务——你真的需要升级微服务架构吗
  2. 2022-2028年中国鸡血石产业市场研究及前瞻分析报告
  3. 2022-2028年中国铝工业投资分析及前景预测报告(全卷)
  4. 【spring】spring基于xml的声明式事务控制
  5. iceberg问题小结
  6. 线程的状态、调度、同步
  7. IP 公司与GPU IP
  8. MindSpore接口mindspore::api
  9. Yolov4性能分析(上)
  10. Lumen报class does not exist的mailer坑