【项目调研+论文阅读】基于BERT的中文命名实体识别方法[J] | day6
《基于BERT的中文命名实体识别方法》王子牛 2019-《计算机科学》
文章目录
- 一、相关工作
- 二、具体步骤
- 1.Bi-LSTM
- 2.CRF结构
- 三、相关实验
- 1.数据集
- 2.参数设置
- 3.实验结果
利用大规模未标注语料对bert行训练,获取文本抽象特征;
利用Bi-LSTM神经网络获取序列化文本的上下文抽象特征;
通过条件随机场CRF进行序列解码标注,提取出相应的实体。
一、相关工作
二、具体步骤
1.Bi-LSTM
采用Graves等提出的改进了LSTM模型中记忆单元和门限机制的版本。
2.CRF结构
替代softmas实现分类。条件随机场CRF能考虑标签序列的全局信息,实现更好的预测。
三、相关实验
1.数据集
1998年人民日报语料。已经分好词,标注了人名、地名、机构名等信息。
使用三元标记集{B,I,O}。B表示实体的第一个词,I表示机构名的其余词,O 表示不属于机构名的词。人名记为 PER,人名的开始记为B-PER;地名记为LOC,地名的开始记为 B-LOC;机构名记为ORG,机构名的开始记为B-ORG。
六月份数据为测试集,1-5月份为训练集。
2.参数设置
Tensorflow搭建。
输入维度seq-length=128
训练集的batchsize=64
测试集的batchsize=8
训练learningrate=2×10e-5
防止训练中出现梯度爆炸,使用梯度夹子,设置参数=5
使用droupout防止过拟合,设为0.5
3.实验结果
【项目调研+论文阅读】基于BERT的中文命名实体识别方法[J] | day6相关推荐
- 论文浅尝 | 利用Lattice LSTM的最优中文命名实体识别方法
本文转载自公众号:机器之心. 选自arXiv 作者:Yue Zhang.Jie Yang 机器之心编译 参与:路.王淑婷 近日,来自新加坡科技设计大学的研究者在 arXiv 上发布了一篇论文,介绍了一 ...
- 【项目实战课】基于BiLSTM+CRF的命名实体识别实战
欢迎大家来到我们的项目实战课,本期内容是<基于BiLSTM+CRF的命名实体识别实战>.所谓项目课,就是以简单的原理回顾+详细的项目实战的模式,针对具体的某一个主题,进行代码级的实战讲解. ...
- 第15课:基于 CRF 的中文命名实体识别模型实现
命名实体识别在越来越多的场景下被应用,如自动问答.知识图谱等.非结构化的文本内容有很多丰富的信息,但找到相关的知识始终是一个具有挑战性的任务,命名实体识别也不例外. 前面我们用隐马尔可夫模型(HMM) ...
- 【项目调研+论文阅读】(目录)中文实体识别研究方法综述 day6
文章目录 一.基于词典和规则的方法 二.基于统计机器学习的方法 1.隐马尔可夫模型(HiddenMarkovMode,HMM)的方法 2.基于最大熵(MaxmiumEntropy)的 方 法 3.基 ...
- 基于BERT预训练的中文命名实体识别TensorFlow实现
BERT-BiLSMT-CRF-NER Tensorflow solution of NER task Using BiLSTM-CRF model with Google BERT Fine-tun ...
- 基于深度学习的命名实体识别研究综述——论文研读
基于深度学习的命名实体识别研究综述 摘要: 0引言 1基于深度学习的命名实体识别方法 1.1基于卷积神经网络的命名实体识别方法 1.2基于循环神经网络的命名实体识别方法 1.3基于Transforme ...
- 中文命名实体识别---基于多特征融合嵌入
来源: AINLPer 微信公众号(每日更新-) 编辑: ShuYini 校稿: ShuYini 时间: 2021-11-18 昨天给大家分享的是一篇EMNLP2021关于关系提取的文章,文章中将关系 ...
- 命名实体:中文命名实体识别简介
一.概念 1.实体 一切具有特定属性集合的物体都可以称为实体. 2.命名实体 一般包括三大类(实体类.时间类.数字类),七小类(人名.机构名.地名.时间.日期.货币和百分比). 3.命名实体识别过程 ...
- NLP之中文命名实体识别
在MUC-6中首次使用了命名实体(named entity)这一术语,由于当时关注的焦点是信息抽取(information extraction)问题,即从报章等非结构化文本中抽取关于公司活动和国防相 ...
最新文章
- 【ACM】杭电OJ 2044 2045
- 二分图的匹配问题以及求解算法
- Android NDK 使用自己的共享库(Import Module)
- Java黑皮书课后题第5章:*5.20(打印2到1000之间的素数)修改程序清单5-15,打印2到1000之间(包括2和1000)的所有素数。每1行显示8个素数,数字之间用一个空格字符隔开
- 2019ICPC南京网络赛A题 The beautiful values of the palace(三维偏序)
- leetcode 刷500道题,笔试/面试稳吗?谈谈算法的学习
- 使用nohup以守护进程方式启动程序
- Creating a blocking QueueT in .NET
- [转载] python处理数据列_Python中基于跨列的数据处理
- android适配各种分辨率的问题
- Linux常用命令英文全称
- VSTO 实现word的多级列表功能
- 屏通触控大师(PM Designer)快速入门
- 六类网线钳能压五类水晶头吗_六类网线可以用五类水晶头不?
- 国内互联网大数据的发展现状和应用
- Nitro League 出品 | P2E 系列 101——第三部分
- 【产业互联网周报】顺丰科技与圣辉征信达成数据流通合作;微软考虑模仿微信,建超级App;中国移动启动算力网络科学装置;...
- STL — 迭代器设计思维(一)
- 欧氏距离详解及在matlab中的实现
- PD866EZ-12D/YCZ多用户预付费电表 上传至西安市能耗平台
热门文章
- 【连载】如何掌握openGauss数据库核心技术?秘诀一:拿捏SQL引擎(4)
- 资源放送丨《数据模型重构案例分享》PPT视频
- 开源自研新基建,内核实践云数据,当此方为嘉年华 - 2020嘉年华大会侧记
- 【社招持续篇】云和恩墨虚位以待,你来不来!
- 缓存最关心的问题是什么
- 关于单元测试的那些事儿,Mockito 都能帮你解决
- 保障实时音视频服务体验,华为云原生媒体网络有7大秘籍
- LiteOS内核源码分析:动态内存之Bestfit分配算法
- 【华为云技术分享】STM32L476移植华为LiteOS系列教程---Kconfig 6
- 【华为云技术分享】云小课 | OBS提供多方面数据安全保障,让存储放心、贴心、省心