java人名识别_HanLP-基于HMM-Viterbi的人名识别
有关于隐马的原理,打算在后边的文章中再去介绍,今天主要介绍一下HanLP是如何利用HMM来做人名识别的。基本思想是把词语序列作为观测序列,将角色序列作为隐藏序列,当模型预测出最佳隐藏状态序列后,利用模式最大匹配法,匹配出人名实体。下边说一模型的三要素在这个应用中所对应的内容,因为训练阶段就是要求解这三个要素的值。
假设有下边的观测序列和其对应的隐藏序列
观察值序列:词1 词2 … 词n
隐变量序列:角色1 角色2 … 角色n
训练阶段:统计三个要素(三个矩阵的元素值)
初始概率分布:
各隐变量标记意义列于下表
状态转移概率分布:
观测概率分布:
有关这些概率值的计算都很简单,就是频率法,留在后边介绍隐马时候再写。
预测阶段:
根据训练得到的三个要素,利用Viterbi算法求解得到了最优隐藏变量序列 角色1* 角色2* ... 角色n*
最大模式匹配阶段:
利用下边的模式串匹配出人名
{ BBCD, BBE, BBZ, BCD, BEE,BE,BG,BXD,BZ,CD,EE,FB, Y,XD}
基于HMM-Viterbi标注的人名识别原理就介绍到这里,我想我应该把原理说清楚了,如果你还没有看明白,就等着后续的有关隐马的文章吧。基于隐马的人名识别会很容把以一个姓氏作为开头的词语识别为人名,特别是地名中有人名字的,因此,人工整理出一些非常用姓氏的人名,以及一些地名是必要的,后续如果整理出来了,我应该会放到专栏文章里,毕竟都是公开语料上做的,也就不涉及什么别的不方便。
接下来说点儿猪一样脑子的笑话。今天猪又发问了,问题是”你知道字段的意思吗?“我实在对这种儿童一样的问题没兴趣答,于是回答”不知道“。这些导数据的人还有点儿脑子没有,没脑子也就罢了,多学习学习呀,改MySQL的技能就不要求了,反正现在MySQL也不开源了,学习学习计算机等级考试教材去吧,我问了一堆自我感觉良好的Java工程师,我觉得这号的连工程师的头衔都不配,顶到头是个中级技师,3级数据库全是设计,我觉得得有一多半人做不出来,当然全体指的不光是Java,所有跟计算机程序打交道的,我也不会。。。狗屁不懂,还老装着很懂,就像汪诚义老师说的,那些工农兵大学的学生,不懂也都说懂。
java人名识别_HanLP-基于HMM-Viterbi的人名识别相关推荐
- Python人脸识别教程 - 基于Python的开源人脸识别库:离线识别率高达99.38%
Python人脸识别教程 - 基于Python的开源人脸识别库:离线识别率高达99.38% 仅用 Python 和命令行就可以实现人脸识别的库开源了.该库使用 dlib 顶尖的深度学习人脸识别技术构建 ...
- 【表盘识别】基于matlab霍夫变换钟表表盘识别【含Matlab源码 1943期】
一.获取代码方式 获取代码方式1: 完整代码已上传我的资源:[表盘识别]基于matlab霍夫变换钟表表盘识别[含Matlab源码 1943期] 点击上面蓝色字体,直接付费下载,即可. 获取代码方式2: ...
- java图片降噪_Java基于opencv实现图像数字识别(四)—图像降噪
Java基于opencv实现图像数字识别(四)-图像降噪 我们每一步的工作都是基于前一步的,我们先把我们前面的几个函数封装成一个工具类,以后我们所有的函数都基于这个工具类 这个工具类呢,就一个成员变量 ...
- delphi 数字识别_基于STM32单片机的车牌识别
系统介绍 使用STM32F103RCT6作为主控,摄像头使用OV7670(带FIFO).STM32进行了16倍频.识别过程分别为:图像采集,二值化,识别车牌区域,字符分割,字符匹配. 识别过程分 ...
- stm32车牌识别_基于STM32单片机的车牌识别
系统介绍 使用STM32F103RCT6作为主控,摄像头使用OV7670(带FIFO).STM32进行了16倍频.识别过程分别为:图像采集,二值化,识别车牌区域,字符分割,字符匹配. 识别过程分 ...
- python 百度ai批量识别_Python基于百度AI的文字识别的示例
Python基于百度AI的文字识别的示例 使用百度AI的文字识别库,做出的调用示例,其中filePath是图片的路径,可以自行传入一张带有文字的图片,进行识别. 下载baidu-aip这个库,可以直接 ...
- 基于matlab的手写体数字识别系统,基于matlab的手写体数字识别系统研究
基于matlab的手写体数字识别系统研究 丁禹鑫1,丁会2,张红娟2,杨彤彤1 [摘要]随着科学技术的发展,机器学习成为一大学科热门领域,是一门专门研究计算机怎样模拟或实现人类的学习行为的交叉学科.文 ...
- 【车牌识别】基于模板匹配实现车牌识别含Matlab源码
1 简介 车牌识别系统是计算机视觉与模式识别技术在智能交通里的重要研究课题之一.其功能是将运动中的汽车牌照从复杂背景中提取出来,并识别出车牌号码.车牌识别技术广泛应用于高速公路上的电子收费,日常的停车 ...
- 【叶片识别】基于matlab LBP植物叶片识别【含Matlab源码 1702期】
一.LBP简介(附lunwen) 第一章 引言 植物在我们的身边随处可见,它们从产生发展进化到现在,其间经历了漫长的岁月.地球上的植物种类繁多.数量浩瀚,它们是生物圈的重要组成部分,在维持整个生物界的 ...
- h5调用指纹识别_基于HTML Canvas实现“指纹识别”技术,canvas指纹
基于HTML Canvas实现"指纹识别"技术,canvas指纹 作者:zhanhailiang 日期:2015-01-31 说明 所谓指纹识别是指为每个设备标识唯一标识符(以下简 ...
最新文章
- RabbitMQ指南(下)
- Interview:算法岗位面试—10.15下午—上海某公司算法岗位(偏机器学习,合资制造行业)技术面试考点之电话面试—研究项目的技术考察
- Linux / openwrt / Ubuntu 18.04 虚拟机中的 openwrt 如何联网
- 西门子逻辑运算指令_西门子S7-300PLC逻辑运算指令
- iOS之深入解析objc_msgSend消息转发机制的底层原理
- Mysql日志-RedoLog、UndoLog和BinLog的关系捋顺
- JMeter记录篇2——性能测试基础(2)
- [ios2] UIView的hitTest,pointInside方法详解【转】
- sql2012 ssrs_您必须在SQL Server Reporting Services(SSRS)中记录的十件事
- 关于php的函数吗,关于PHP的函数运行你了解多少?
- Java并发编程之原子类
- #牛客网 2018年牛客多校算法寒假训练营练习比赛(第五场)
- 网站加了CDN后,字体图标报错Access-Control-Allow-Origin
- iMeta观点 | 短读长扩增子测序是否适用于微生物组功能的预测?
- Unity实现瞄准镜效果之美
- geany的安装与使用
- 吃得苦中苦 方为人上人
- 专栏推介:《Hi3861网络编程实验》
- ds存储查看 linux,我的NAS我的地盘 篇五:群晖NAS软件介绍与应用之DS Audio篇
- 路由传参说有几种方式