【项目调研+论文阅读】(目录)中文实体识别研究方法综述 day6
文章目录
- 一、基于词典和规则的方法
- 二、基于统计机器学习的方法
- 1.隐马尔可夫模型(HiddenMarkovMode,HMM)的方法
- 2.基于最大熵(MaxmiumEntropy)的 方 法
- 3.基 于 支 持 向 量 机(SupportVectorMachine,SVM)的方法
- 4.基于条件随机场(ConditionalRandomFields,CRF)的方法
- 5.基于统计中的自增长统计算法的方法
- 三、基于统计与规则结合的方法
- 四、基于深度学习的方法
- 五、近期方法
《中文命名实体识别研究方法综述》李嘉欣 陆军工程大学
一、基于词典和规则的方法
构建大量的规则集或字典,然后按照需求将需要识别的汉字串放入制定的规则集中或与所构建的字典进行匹配,经过多次修正直到匹配成功。但这种方法只能在小数据集上得到很好的准确率,而随着数据集中数据的增加这种方式变得不再适用。
缺点:只能在特定的语料上识别能够得到很高的准确度,这样随着需要识别的实体多样化就需要制定更多的规则和更大的词典。
二、基于统计机器学习的方法
1.隐马尔可夫模型(HiddenMarkovMode,HMM)的方法
2.基于最大熵(MaxmiumEntropy)的 方 法
3.基 于 支 持 向 量 机(SupportVectorMachine,SVM)的方法
4.基于条件随机场(ConditionalRandomFields,CRF)的方法
5.基于统计中的自增长统计算法的方法
三、基于统计与规则结合的方法
四、基于深度学习的方法
[14]2015:YonghuiW, MinJiang, JianboLei, HuaXu. Named Entity
Recognitionin Chinese Clinical Text Using Deep Neural Network. Studiesin Health Technology and Informatics,2015:624-628
[15]BILSTM-CRF:Zhiheng Huang,Wei Xu and Kai Yu.Bidirectional LSTM-CRF Models for Sequence Tagging[J]. arXiv,2015.1508.01991
[16]2016-BILSTM-CNNs-CRF:MAX, HOVYE. End-to-end Sequence Labeling ViaBi-directional LSTM-CNNs-CRF[J]. arXivpreprintarXiv:1603.01354,2016
五、近期方法
在循环神经网络模型中引入门控 GRU模型。使用CNN、SVM、Lattice、BERT 等模型进行语言预训练,并引入注意力机制、迁移学习等提高命名实体识别的准确度。
[17]SVM-BILSTM-CRF:周晓磊,赵薛蛟,刘堂亮,宗子潇,王其乐,里剑桥 . 基于SVM-BILSTM-CRF模型的财产纠纷命名实体识别方法[J].计算机系统应用,2019.28(1):245-250
[18]LatticeLSTM:王博冉,林夏,朱晓东,朱万琳,马学华 .LatticeLSTM 神经网
络法中文医学文本命名实体识别模型研究[J].中国卫生信息管理杂志,2019.16
[19]BERT 和 BILSTM-CRF:王子牛,姜猛,高建瓴,陈娅先 . 基于 BERT 的中文命名实体识别方法[J].计算机科学,2019.46(S2):138-142
14-19文章分析之后会单独整理。
【项目调研+论文阅读】(目录)中文实体识别研究方法综述 day6相关推荐
- 【项目调研+论文阅读】基于医学文献的实体抽取(NER)方法研究 day5
一.<基于文献的药物表型实体识别及关系抽取方法研究>北京交通大学-张琛 表型实体:疾病.体症.基因.化学物质和药物名称. 信息提取的传统方法分为三步:命名实体识别.关系抽取.事件抽取. - ...
- 【项目调研+论文阅读】基于BERT的中文命名实体识别方法[J] | day6
<基于BERT的中文命名实体识别方法>王子牛 2019-<计算机科学> 文章目录 一.相关工作 二.具体步骤 1.Bi-LSTM 2.CRF结构 三.相关实验 1.数据集 2. ...
- 【项目调研+论文阅读】Lattice LSTM神经网络医学文本命名实体识别 | day7
<Lattice LSTM神经网络法中文医学文本命名实体识别模型研究>2019 文章目录 一.模型步骤 1.Lattiice-LSTM分词+表征词汇 2.LSTM-CRF 经证实,英文N ...
- 【*项目调研+论文阅读】SVM-BILSTM-CRF模型SVM-BILSTM-CRF模型 | day7
<基于SVM-BILSTM-CRF模型的财产纠纷命名实体识别方法>2018-<计算机系统应用> 文章目录 一.SVM-BiLSTM-CRF 模型 1.SVM 2.Bi-LSTM ...
- 【转】用IDCNN和CRF做端到端的中文实体识别
本文转载自:用IDCNN和CRF做端到端的中文实体识别 代码在: NER_IDCNN_CRF 上篇文章聊到了关系提取,今天来聊聊实体识别. 实体识别和关系抽取是例如构建知识图谱等上层自然语言处理应用的 ...
- 让机器认知中文实体 — 复旦大学知识工场发布中文实体识别与链接服务
一.什么是实体识别与链接 近年来,如何通过知识图谱让机器实现自然语言理解受到越来越多的关注.其中,识别文本中的实体,并将它们链接到知识库中,是让机器理解自然语言的第一步,也是至关重要的一步.比如,当智 ...
- 基于深度学习的命名实体识别研究综述——论文研读
基于深度学习的命名实体识别研究综述 摘要: 0引言 1基于深度学习的命名实体识别方法 1.1基于卷积神经网络的命名实体识别方法 1.2基于循环神经网络的命名实体识别方法 1.3基于Transforme ...
- 一文详解中文实体识别模型 Lattice LSTM
每天给你送来NLP技术干货! 来自:AI算法小喵 写在前面 今天要跟大家分享的是西湖大学张岳老师2018年发表在顶会ACL上的一篇中文实体识别论文 Lattice LSTM. 论文名称:<Chi ...
- 知识工场 | 让机器认知中文实体 —复旦大学知识工场发布中文实体识别与链接服务
本文转载自公众号:知识工场. 一.什么是实体识别与链接 近年来,如何通过知识图谱让机器实现自然语言理解受到越来越多的关注.其中,识别文本中的实体,并将它们链接到知识库中,是让机器理解自然语言的第一步, ...
最新文章
- vb科学计算机x y,vb程序用vb实现系统的计算器功能1/x,sqrt,%,+/-, 爱问知识人
- 创建php数组的方法,创建PHP数组的方法讲解
- Linux CenOS7下安装ActivetMQ
- gogs创建项目_容器云平台No.10~通过gogs+drone+kubernetes实现CI/CD
- LeetCode 75. Sort Colors (python一次遍历,模拟三路快排)
- 这个陶瓷电阻烙铁架不错哦,最新一期的电子趣事分享给大家
- C语言手写二叉树(链式存储结构)
- 哈希桶 entry_聊一聊面试常问的几大哈希算法问题,这些你都会了嘛??
- 19-[模块]-xml
- informix利用dbaccess倒出数据
- vmVare使用NAT模式-配置详情
- 《C#高效编程》读书笔记04-使用Conditional特性而不是#if条件编译
- 解决ojdbc7依赖下载失败
- sscanf_s函数用法
- 【工具封装】不用 for 循环, 教你如何向MySQL数据库批量插入数据
- 深度学习:词向量和句向量(Embedding)
- 计算机无法找到网络打印机,为何搜索不到局域网打印机_解决win7找不到网络打印机的问题...
- 854计算机基础——备考建议+近年考点汇总
- 玩于鼓掌之中的小老虎机——Tiny Tiger Machine
- BLOCK层代码分析(9)IO下发之IO下发
热门文章
- spring框架做全局异常捕获_springboot springmvc抛出全局异常的解决方法
- python导入类属性不存在_为什么我会得到一个错误:我的类中不存在该属性?
- 本周四晚8点直播预告丨探秘MySQL极限,解锁核心运维关卡
- 58个PPT下载丨2019 PostgreSQL中国技术大会资源放送
- Oracle宣布在云上正式上线 自治事务处理数据库
- 论文解读二十七:文本行识别模型的再思考
- Python 绑定:从 Python 调用 C 或 C++
- 机器学习入门:多变量线性回归
- 用了这个评估优化LiteOS镜像利器,我有点飘...
- 大型情感剧集Selenium:3_元素定位 #华为云·寻找黑马程序员#