最近在学习用hanlp分词做关键词提取,但是现在有一个问题,虽然hanlp中各种功能直接调用很方便了,那么如果我需要从人名识别中仅仅提取出人名怎么操作呢?
我按照官方的示例代码,发现输出的list是人名后面带有nr标记,我应该怎么操作把人名提出来呢?
java小白,多谢大神们的指教!
附上官方执行的结果:
[签约/v, 仪式/n, 前/f, ,/w, 秦光荣/nr, 、/w, 李纪恒/nr, 、/w, 仇和/nr, 等/u, 一同/d, 会见/v, 了/ul, 参加/v, 签约/v, 的/uj, 企业家/n, 。/w]
[王国强/nr, 、/w, 高峰/n, 、/w, 汪洋/n, 、/w, 张朝阳/nr, 光着头/l, 、/w, 韩寒/nr, 、/w, 小四/nr]
[张浩和/nr, 胡健康/nr, 复员/vn, 回家/v, 了/ul]
[王总/nr, 和/c, 小丽/nr, 结婚/v, 了/ul]
[编剧/n, 邵钧林/nr, 和/c, 稽道青/nr, 说/v]
[这里/r, 有/v, 关天培/nr, 的/uj, 有关/vn, 事迹/n]
[龚学平/nr, 等/u, 领导/n, ,/w, 邓颖超/nr, 生前/t]
附上官方网站的示例代码
String[] testCase = new String[]{

“签约仪式前,秦光荣、李纪恒、仇和等一同会见了参加签约的企业家。”,
“王国强、高峰、汪洋、张朝阳光着头、韩寒、小四”,
“张浩和胡健康复员回家了”,
“王总和小丽结婚了”,
“编剧邵钧林和稽道青说”,
“这里有关天培的有关事迹”,
“龚学平等领导,邓颖超生前”,
};
Segment segment = HanLP.newSegment().enableNameRecognize(true);
for (String sentence : testCase)
{

List termList = segment.seg(sentence);
System.out.println(termList);
}

文章来源于William的博客

hanlp 如何快速从分词仅取出人名相关推荐

  1. 基于 HanLP 的 ES 中文分词插件

    一.分词插件 1.分词器概念 在 ES 中,分词器的作用是从文本中提取出若干词元(token)来支持索引的存储和搜索,分词器(Analyzer)由一个分解器(Tokenizer).零个或多个词元过滤器 ...

  2. EXCEL 两列名字 如何快速查看缺少了哪些人名

    问题:EXCEL 两列名字 如何快速查看缺少了哪些人名 第一张表为人员姓名底表,A列为姓名,共500人:第二张表中A列姓名中只有490人,如何比较两张表,快速找到这缺失的10人是哪几位 方法: 比如A ...

  3. python使用HanLP命名实体识别(以识别人名为例)

    首先需要安装依赖包:pip install pyhanlp 识别人名的代码如下: from pyhanlp import HanLPdef extract_chinese_name(string: s ...

  4. Hanlp在java中文分词中的使用介绍

    项目结构 该项目中,.jar和data文件夹和.properties需要从官网/github下载,data文件夹下载 项目配置 修改hanlp.properties: 1 #/Test/src/han ...

  5. jieba分词提取小说人名

    文章目录 1. 读入文本 2. 分词 3. 计数 4. 排序 5. 添加用户字典 以<神雕侠侣>为例: 使用 jieba.posseg获取词性,人名的词性为 nr 1. 读入文本 impo ...

  6. [APP]Ubuntu快速安装微信(仅需1分钟)

    [APP]如何在Debian/Ubuntu上快速安装微信----最简deepin-wine版 原文链接:https://github.com/zq1997/deepin-wine 今天在Ubuntu上 ...

  7. Pytorch:jieba分词、hanlp分词、词性标注、命名实体识别、one-hot、Word2vec(CBOW、skipgram)、Word Embedding词嵌入、fasttext

    日萌社 人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战(不定时更新) 文本预处理及其作用: 文本语料在输送给模型前一般需要一系列的预 ...

  8. 第02课:简单好用的中文分词利器 jieba 和 HanLP

    前言 从本文开始,我们就要真正进入实战部分.首先,我们按照中文自然语言处理流程的第一步获取语料,然后重点进行中文分词的学习.中文分词有很多种,常见的比如有中科院计算所 NLPIR.哈工大 LTP.清华 ...

  9. 中文HanLp分词入门

    入门 # 比如我们要对 `我来到中华人民共和国` 这句话做一个分词,我们来人为分一下 1. 我 / 来到 / 中华人民共和国 2. 我 / 来到 / 中华 / 华人 / 人民 / 中华人民 / 中华人 ...

  10. NLP第2课:中文分词利器 jieba 和 HanLP

    前言 从本文开始,我们进入实战部分.首先,我们按照中文自然语言处理流程的第一步获取语料,然后重点进行中文分词的学习.中文分词有很多种,常见的比如有中科院计算所 NLPIR.哈工大 LTP.清华大学 T ...

最新文章

  1. [android] 从gallery获取图片
  2. 无线红外探测器04:产品测试及验证
  3. opencv文件路径问题
  4. STM32 基础系列教程 38 - Lwip_http
  5. Axios——Axios封装DEMO
  6. leetcode-19-删除链表的倒数第N个节点
  7. RocketMQ源码解析:Filtersrv
  8. 电脑pin重置_如果忘记了如何重置Windows PIN
  9. springboot thymeleaf 引入jquery_超详细实战:SpringBoot高级之autoconfigure自动化配置
  10. ios开发ocr识别_传统图像处理技术,ocr识别技术算法
  11. JDBC Statements, PreparedStatement
  12. Use Amazon VM to try Openstack (1) (with DevStack)
  13. 输入一组数,找出满足某条件的数
  14. LSTM模型实战案例:TensorFlow实现预测3位彩票号码
  15. 色彩空间RGB/CMYK/HSL/HSB/HSV/Lab/YUV基础理论及转换方法:RGB与YUV
  16. golang 调度之wakep和M创建
  17. 14-HAL库之I2C通信
  18. excel里面时间加减
  19. PPP模式与城市视频监控项目结合产效应
  20. 使用Verilog设计1553B总线协议芯片

热门文章

  1. win10中常用快捷键 (包括切换窗口、打开我的电脑等快捷键)
  2. 一般现在时,主语为第三人称单数,例句说明
  3. 为什么计算机里没有桌面显示不出来,电脑开机不显示桌面怎么办解决教程
  4. 从零开始学PCR技术(一):PCR技术简介
  5. C语言结构体,共用体所占字节数计算
  6. zone在linux中的含义,linux-日常运维-firewalld的9个zone
  7. 优盘在计算机上无法显示,U盘在电脑上不显示的原因
  8. 苹果电脑系统如何读取移动硬盘数据?
  9. android button 点击没有音效
  10. matlab 数据白化,数据白化