摘要

现有的人员简历信息抽取方法无法针对金融公告中非结构化人员简历进行人员属性以及事件的抽取,无法发现金融公告中跨文档的人员之间关系。针对以上问题,将非结构化的人员简历抽取成结构化的人员信息模板,提出一种金融领域人物关系图谱构建方法。通过对BERT预训练语言模型进行训练,抽取出非结构化人员简历文本中的人员属性实体,利用训练好的BERT预训练模型获取事件实例向量,对事件实例向量进行准确的分类,填充层次化的人员信息模板,准确地关联人员属性。进一步地,通过填充好的人员信息模板,提取人员关系,构建人物关系图谱。通过构建人工标注的数据集,进行实验验证。实验表明所提出的方法可以有效解决非结构化金融人员简历文本信息提取问题,有效地构建金融领域人物关系图谱。

关键词: 深度学习; 信息提取; 预训练语言模型; 人物关系图谱

信息化时代下,金融行业的各个公司、监管机构每天都会在互联网上发布大量的公告,将公告中的人员实体以及相关属性提取出来,发现人员之间的隐含关系,以结构化的形式描述金融行业中与人物相关的概念、实体及其关系,

BERT辅助金融领域人物关系图谱构建相关推荐

  1. 知识图谱初探(二)三体人物关系图谱构建

    <三体>电视剧正在热播,忽然觉得如果用知识图谱来构建下其中的人物关系,想必应该有趣! 那我们就开始吧! 首先列一下其中的相关人物 叶文洁 叶文雪 沙瑞山 杨冬 杨卫宁 白沐霖 邵琳 叶哲泰 ...

  2. PersonGraphDataSet近十万的开放人物关系图谱项目

    PersonGraphDataSet PersonGraphDataSet, nearly 10 thousand person2person relationship facts that buil ...

  3. dbpedia知识图谱java_一种基于DBpedia的水务领域概念知识图谱构建方法与流程

    本发明涉及的是领域知识图谱构建技术领域,涉及到一种基于DBpedia的水务领域概念知识图谱构建方法,特别涉及到一种基于Jaccard相似度算法与随机游走相似度算法结合的协同过滤模型框架,用于补全概念模 ...

  4. 金庸小说人物知识图谱构建——图谱可视化

    读取上步得到的共现矩阵,将人物间的共现频次提取处理,形成如下CSV文件 这一步的代码如下 import xlrddef readxls(path):xl = xlrd.open_workbook(pa ...

  5. python简单实战项目:《冰与火之歌1-5》角色关系图谱构建

    前两天<权力的游戏>第七季发布了第二弹预告片,思索的第七季也快要来了,正想着脑子突然一热,要不弄个<权利的游戏>的角色共现图谱吧.故事里面的人物关系复杂程度也是出了名了的,如果 ...

  6. Python + Neo4j(安装)可视化分析漫威十年人物关系图谱

    目录 1 数据爬取 1.1 漫威人物关系图谱网站 1.2 爬取人物关系数据 2 Neo4j的安装及服务启动 2.1 Neo4j下载安装 2.2 开启Neo4j服务 3 数据准备 3.1 加入列名 3. ...

  7. 在图数据库Neo4j中创建红楼梦人物关系图谱

    在图数据库Neo4j中创建红楼梦人物关系图谱 1.加载csv数据文件 load csv from 'file:///triples.csv' as linecreate (:role {name:li ...

  8. [转载]红楼梦四大家族人物关系图谱(12系列图表)_RWERWERWE_96921_新浪博客

    原文地址:红楼梦四大家族人物关系图谱(12系列图表) 作者: 静心聆听62 红楼梦主要人物关系 01红楼梦四大家族人物关系图谱 02红楼梦人物关系简图 03红楼梦人物关系详图 04红楼梦四大家族奴隶图 ...

  9. Python来袭,教你用Neo4j构建“复联4”人物关系图谱!没有剧透!【文末赠书】...

    讲技术之前先引个好玩的热点话题,带你与时代接轨~ 漫威系列电影<复仇者联盟4>上映 你去看了吗? 小编就盼着周末去好好享受 谁剧透,跟谁急! 复仇者联盟 之 绝对不剧透 漫威英雄们为了不让 ...

最新文章

  1. 【资料】wpcap.dll/Packet.dll库中相应函数
  2. Spring Boot 启动加载数据 CommandLineRunner
  3. Django上传文件及分页
  4. alternatives命令使用方法
  5. Oracle入门(十四.21)之创建DML触发器:第二部分
  6. 前端学习(3289):object.define2
  7. 保存的图数据丢失_锡柴自主刷写和备份共享数据文件使用介绍
  8. 李洪强经典面试题37
  9. 运行wpf_在WPF中一种较好的绑定Enums数据方法
  10. Java多线程——同步容器类
  11. Linux内核开发_将Linux内核打包成img文件
  12. linux下高可用性群集和负载均衡群集的实现
  13. 六年一轮回:大数据改变的,不仅仅是我的专业!
  14. 医院管理系统明细 HIS源码
  15. 计算机一级和二级考试内容有什么不同吗?
  16. Web:flex模拟移动商城首页页面布局/grid布局的相关属性
  17. [usaco6.1.1Postal Vans]
  18. 国际战略中aaa模式_AAA游戏中的微交易将继续存在(但仍然很糟糕)
  19. Android Notification 详解(各版本对比)——基本操作
  20. 计算机英语讲课笔记08

热门文章

  1. java图片添加水印实现自动换行
  2. Socket编程之简单介绍 - 蓝天下的雨 - 博客园
  3. 基于python的药店管理系统_Python实践案例:药店销售数据分析
  4. 使用学生账号来激活使用Jetbrains全家桶
  5. 安装打印机0X0000007e报错
  6. mysql 拼接json
  7. MySQL 让你拥有不一样感觉
  8. windows计算机搜索记录,Windows7系统中的搜索记录如何清除有哪些方法
  9. 毕业赠言吧:不要怕,向前走;及最简单的方法,遍历
  10. Cadence 17.2 软件使用(3)— 绘制电阻、电容、LED等简单元器件的原理图Symbol库