人名识别

在HanLP中,基于角色标注识别了中国人名。首先系统利用隐马尔可夫模型标注每个词语的角色,之后利用最大模式匹配法对角色序列进行匹配,匹配上模式的即为人名。理论指导文章为:《基于角色标注的中国人名自动识别研究》,大家可以百度一下看看

地名识别

理论指导文章为:《基于层叠隐马尔可夫模型的中文命名实体识别》

机构名识别

机构名的理论指导文章为:《基于角色标注的中文机构名识别》

命名实体识别Demo

/*

  • <summary></summary>
  • <author>He Han</author>
  • <email>hankcs.cn@gmail.com</email>
  • <create-date>2014/12/7 19:25</create-date>
  • <copyright file="DemoChineseNameRecoginiton.java" company="上海林原信息科技有限公司">
  • Copyright (c) 2003-2014+ 上海林原信息科技有限公司. All Right Reserved+
  • This source is subject to the LinrunSpace License. Please contact 上海林原信息科技有限公司 to get more information.
  • </copyright>
    */
    package com.hankcs.demo;

import com.hankcs.hanlp.HanLP;
import com.hankcs.hanlp.seg.Segment;
import com.hankcs.hanlp.seg.common.Term;

import java.util.LinkedList;
import java.util.List;

public class DemoNer {
// 实例化实体分词器
public static Segment segment = HanLP.newSegment().enableNameRecognize(true).enablePlaceRecognize(true).enableOrganizationRecognize(true);

// 识别中文人名、中文地名、中文机构名
public static List<Term> recognizeNER(String text) {List<Term> ner_li = new LinkedList<Term>();List<Term> termList = segment.seg(text);for(Term term: termList) {String nature = term.nature != null ? term.nature.toString() : "空";if(nature.equals("nr")) {ner_li.add(term);}else if(nature.equals("ns")) {ner_li.add(term);}else if(nature.equals("nt")) {ner_li.add(term);}}return ner_li;
}public static void main(String[] args)
{// 人名识别示例String[] test_person_case = new String[]{"签约仪式前,秦光荣、李纪恒、仇和等一同会见了参加签约的企业家。","武大靖创世界纪录夺冠,中国代表团平昌首金","区长庄木弟新年致辞","朱立伦:两岸都希望共创双赢 习朱历史会晤在即","陕西首富吴一坚被带走 与×××妻子有交集","据美国之音电台网站4月28日报道,8岁的凯瑟琳·克罗尔(凤甫娟)和很多华裔美国小朋友一样,小小年纪就开始学小提琴了。她的妈妈是位虎妈么?","凯瑟琳和露西(庐瑞媛),跟她们的哥哥们有一些不同。","王国强、高峰、×××、张朝阳光着头、韩寒、小四","张浩和胡健康复员回家了","王总和小丽结婚了","编剧邵钧林和稽道青说","这里有关天培的有关事迹","龚学平等领导说,×××生前杜绝超生","蓝翔给宁夏固原市彭阳县红河镇黑牛沟村捐赠了挖掘机","我在上海林原科技有限公司兼职工作,","我经常在台川喜宴餐厅吃饭,","偶尔去开元地中海影城看电影。","不用词典,福哈生态工程有限公司是动态识别的结果。"};for (String sentence : test_person_case){List<Term> termList = recognizeNER(sentence);System.out.println(sentence + "\t" + termList.toString());}}

}

【文章来源:整理自 baiziyu 的知乎专栏】

HanLP-命名实体识别总结相关推荐

  1. python使用HanLP命名实体识别(以识别人名为例)

    首先需要安装依赖包:pip install pyhanlp 识别人名的代码如下: from pyhanlp import HanLPdef extract_chinese_name(string: s ...

  2. pyhanlp 命名实体识别

    pyhanlp中的命名实体识别 对于分词而言,命名实体识别是一项非常重要的功能,当然发现新词同样重要(这部分内容被我放在之后的"提取关键词.短语提取与自动摘要.新词识别"与再之后的 ...

  3. python调用Hanlp做命名实体识别以及词性标注

    之前需要做一个中文命名实体识别的api,看完了一些相关论文以后觉得短时间内自己实现不大现实,于是找了一些开源工具,其中哈工大的LTP效果是很好的,但是免费使用限流量,需要给钱才行: NLPIR的pyn ...

  4. Pytorch:jieba分词、hanlp分词、词性标注、命名实体识别、one-hot、Word2vec(CBOW、skipgram)、Word Embedding词嵌入、fasttext

    日萌社 人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战(不定时更新) 文本预处理及其作用: 文本语料在输送给模型前一般需要一系列的预 ...

  5. 文本预处理的基本方法(分词、词性标注、命名实体识别)

    文本预处理及其作用 文本语料在输送给模型前一般需要一系列的预处理工作, 才能符合模型输入的要求, 如: 将文本转化成模型需要的张量, 规范张量的尺寸等, 而且科学的文本预处理环节还将有效指导模型超参数 ...

  6. NLP(5) | 命名实体识别

    NLP(1) | 词向量one hot编码词向量编码思想 NLP(2) | 中文分词分词的概念分词方法分类CRFHMM分词 NLP(3)| seq to seq 模型 NLP(4) | 用词向量技术简 ...

  7. 初学者 | 一文读懂命名实体识别

    本文对自然语言基础技术之命名实体识别进行了相对全面的简绍,包括定义.发展历史.常见方法.以及相关数据集,最后推荐一大波python实战利器,并且包括工具的用法. 定义 先来看看维基百科上的定义:Nam ...

  8. 用CRF做命名实体识别——NER系列(三)

    在上一篇文章<用隐马尔可夫模型(HMM)做命名实体识别--NER系列(二)>中,我们使用HMM模型来做命名实体识别,将问题转化为统计概率问题,进行求解.显然,它的效果是非常有限的. 在深度 ...

  9. 用隐马尔可夫模型(HMM)做命名实体识别——NER系列(二)

    上一篇文章里<用规则做命名实体识别--NER系列(一)>,介绍了最简单的做命名实体识别的方法–规则.这一篇,我们循序渐进,继续介绍下一个模型--隐马尔可夫模型. 隐马尔可夫模型,看上去,和 ...

  10. 介绍几个专门面向中文的命名实体识别和关系抽取工具

    知识图谱已经在人工智能的各个领域发挥越来越重要的作用,例如视觉问答.对话系统.推荐系统等.知识图谱构建是应用这些知识图谱的基础,而面对生活和企业中数据的爆发式增长,自动化知识图谱构建显得越来越重要.从 ...

最新文章

  1. Windows azure 上将Legcay IO操作轻松切换到Blob
  2. Shell脚本编程01:基础知识
  3. 堡垒机的使用-及功能
  4. 阿里如何应对亿级高并发大流量?如何保障高可用和稳定性!
  5. linux vma,内存管理 – Linux内核API find_vma
  6. ❤️《10个超级常用Python方法总结》复制即用丨小白捷径【文末赠书2本】❤️
  7. 服务器2003光盘修复,windows光盘修复系统
  8. WPF中的命令与命令绑定(二)
  9. 使用Angularjs的ng-cloak指令避免页面乱码
  10. limit where group by having select
  11. 入门:Mac终端常用知识
  12. 计算机上已安装某个第三方应用程序,防止电脑第三方软件“被”安装 3招彻底屏蔽不明软件...
  13. html5拼音显示,HTML5:给汉字加拼音?收起展开组件?
  14. 2017年最牛逼的分类Android项目源码免费一次性打包下载!
  15. 第二步:创建html模板及文件目录等
  16. 家喻户晓的足力健,凭什么征服中老年人?
  17. 支付宝付款弹窗 被浏览器拦截
  18. EVE-NG 上传IOL镜像
  19. Jupyter Notebook简洁教程
  20. 开水果店流程,开水果店的流程

热门文章

  1. DAY1(02-HTML标签(上))
  2. sox源码分析:sox_find_effect()
  3. 成长,从你发现自己写的代码很LOW开始
  4. 电机控制的fast decay与slow decay
  5. 使用命令行——查看笔记本电池损耗程度
  6. threeJS鼠标单击模型边缘高亮
  7. 从程序员到数据科学家:SAS 编程基础 (07)- 常量与变量
  8. APS计划排产软件在食品饮料行业的应用
  9. 计算机专业的求职信英文版带翻译,[求职信英语作文带翻译]求职信的英语作文4篇...
  10. 「免费 | 重磅」9月19日首届智能决策论坛即将开幕!(附带10+位作者演讲主题及摘要)「中国科学院自动化研究所」...