一、研究背景

煤矿安全领域存在着结构化、半结构化以及非结构化等不同种类的数据格式,不同的存储及关联方式,导致煤矿安全领域数据呈现海量离散低效的特点,数据无法被有效地运用起来。构建一个逻辑清晰、覆盖范围广的煤矿安全知识图谱,以帮助煤矿工作人员或对煤矿有兴趣的学者全面查询及学习煤矿安全知识。

知识图谱的本质是一种知识表示形式,通过从多源文本中将隐藏的实体、关系抽取出来,并构成(实体-关系-实体)结构化的数据。知识图谱的应用场景分为水平知识图谱和垂直知识图谱两类,垂直知识图谱即只涉及一个领域的知识图谱,要求知识具有一定的深度;而水平知识图谱为涉及多个领域的知识图谱,如日常生活中的常识性问题等组成的知识图谱等。

表1  水平知识图谱与垂直知识图谱对比

知识图谱类型 广度 深度 细化程度 专家参与 自动化程度
水平知识图谱 粗粒度 轻度
垂直知识图谱 细粒度 重度

则煤矿安全领域知识图谱的构建属于垂直知识图谱构建,需要更深的知识层次,需要煤矿安全领域专家参与以及为了追求知识图谱的质量,必然需要更多人工,自动化程度低。

二、专业领域知识图谱国内外现状

1.LinkedIMDB是由Hassanzadeh等构建的电影领域知识图谱,RDF三元组数量几百万之多;

2.UMLS是美国医学图书馆参与研究开发的医学术语知识图谱系统,该系统包含数百万医学实体及其相互关系;

3.2017年,杜泽宇等人利用知识图谱构建技术构建了电商领域知识图谱;

4.2018年,哈工大的张元博使用Bootstrapping算法和条件随机场构建了医疗图谱的知识库并验证了这方法的可行性;

5.2019年,经过对中国知网等许多期刊文献收录的国内空中交通管理资料进行分析,王建辉等人利用知识图谱实现了空中交通管理分析及可视化;

6.基于2020年新冠疫情OpenKG发布了百科、事件、临床、英雄事迹等一系列新冠开发知识图谱供公共使用。

三、研究内容

1.利用教科书、文献、煤矿安全规程、网络爬虫等途径收集关于煤矿安全数据集中的数据,并对数据进行预处理,构建数据集,对数据进行人工标注,80%作为训练集,10%作为测试集,另外10%作为验证集;

2.从多源煤矿安全文献资料中抽取大量煤矿安全概念实体。使用ALBERT中文预处理模型生成具有上下文信息的词向量,使用MLP将公共数据集THUCNews与ALBERT-BiLSTM模型训练获取到的输出参数作为煤矿安全数据集模型训练的输入参数。最终,构建ALBERT-BiLSTM-MLP-CRF模型进行命名实体识别任务;

3.针对煤矿安全规程文本数据,利用依存句法分析进行知识抽取。采用哈工大开发的自然语言处理平台LTP进行分词以及依存句法分析,获取实体关系并形成三元组;

4.构建煤矿安全领域知识库,把命名实体识别和关系抽取得到的煤矿安全三元组存储到Neo4j图数据库中,完成煤矿安全知识库构建工作;

5.开发煤矿安全领域知识图谱可视化系统。

图1   研究内容流程图

知识图谱应用——煤矿安全知识图谱构建技术研究学习相关推荐

  1. 装备保障性验证知识图谱构建方法研究-学习笔记

    装备保障性验证知识图谱构建方法研究 领域知识图谱构建 在逻辑层面,知识图谱通常可以划分为数据层和模式层两个层次.数据层主要是将领域中的多源异构数据转换为三元组的形式,通过一系列三元组表达领域知识或者常 ...

  2. 领域应用 | 基于知识图谱的警用安保机器人大数据分析技术研究

    本文转载自公众号:警察技术杂志. 郝久月  樊志英   汪宁   王欣   摘   要:构建大数据支撑下的智能应用是公安信息化发展的趋势,警用安保机器人大数据分析平台的核心功能包括机器人智能人机交互和 ...

  3. 智能驾驶仿真场景构建技术

    随着汽车智能化程度的不断提高,智能汽车通过环境传感器与周边行驶环境的信息交互与互联更为密切,需应对的行驶环境状况也越来越复杂,包括行驶道路.周边交通和气象条件等诸多因素,具有较强的不确定性.难以重复. ...

  4. 知识图谱构建技术初探

    自底向上--知识图谱构建技术初探 from: https://www.anquanke.com/post/id/149122 发布时间:2018-06-28 16:00:40 文/阿里安全 染青 &q ...

  5. 技术动态 | 知识图谱构建的研究已走入下半场,但大规模落地应用仍需时间

    本文转载自公众号:AI前线. 作者 | 李冬梅 采访嘉宾 | 唐杰 知识图谱是近年来人工智能技术蓬勃发展的核心驱动力之一,已广泛应用在金融.电商.医疗.政务等众多领域,经过短短几年的发展,热度依旧不减 ...

  6. 自底向上——知识图谱构建技术初探

    摘要: 知识图谱,是结构化的语义知识库,用于迅速描述物理世界中的概念及其相互关系,通过将数据粒度从document级别降到data级别,聚合大量知识,从而实现知识的快速响应和推理. 文/阿里安全 染青 ...

  7. 虚拟专题:知识图谱 | DDoS攻击恶意行为知识库构建

    来源:电信科学 DDoS攻击恶意行为知识库构建 刘飞扬, 李坤, 宋飞, 周华春 北京交通大学电子信息工程学院 摘要:针对分布式拒绝服务(distributed denial of service,D ...

  8. NLP实践|CCKS2020金融知识图谱自动化构建技术方法总结

    每天给你送来NLP技术干货! 编辑:AI算法小喵 写在前面 文本是参加2020CCKS评测 基于本体的金融知识图谱自动化构建技术 之后的一篇总结博客,笔者查阅了大量文献,并做了大量采用深度学习模型的实 ...

  9. 【知识图谱】深入浅出讲解知识图谱(技术、构建、应用)

    本文收录于<深入浅出讲解自然语言处理>专栏,此专栏聚焦于自然语言处理领域的各大经典算法,将持续更新,欢迎大家订阅! 个人主页:有梦想的程序星空 个人介绍:小编是人工智能领域硕士,全栈工程师 ...

最新文章

  1. 「译」有限状态机在 CSS 动画中的应用
  2. Java快速判断是不是手机号
  3. 技术者的好奇心和惯性
  4. 多层PCB的叠层板材
  5. python的tkinter窗口位置\坐标\大小等知识(自用笔记)
  6. 使用CreateProcess创建进程
  7. 谷歌新作gVisor:VM容器融合技术已经到来
  8. window安装mysql默认密码忘记_window10 安装Mysql 8.0.17以及忘记密码重置密码
  9. 爱拉托逊斯方法以及素数判断
  10. 210228Linux 条件变量 线程池
  11. 【.NET Core 3.1】 策略授权中获取权限数据
  12. UVA4671 K-neighbor substrings FFT+字符串hash
  13. web 页面table 斜线效果 跨越多行和 多列
  14. php mkdir没有权限不能创建成功的问题
  15. [转]linux 调用动态库so文件
  16. javasocket编程例子,给大家安排上!
  17. C++刷题: 逆波兰表达式(力扣150题)
  18. CodeCraft-20 (Div. 2) E. Team Building(状压dp)
  19. pytorch中的normalize应用
  20. 小程序苹果手机底部出现横杠处理

热门文章

  1. 已解决java.lang.ClassCastException: java.util.ArrayList cannot be cast to java.util.Map异常的正确解决方法,亲测有效!!
  2. Android高工:okhttp原理详解,搞懂了直接去虐面试官
  3. 【防火墙 配置VRRP】
  4. flvdec.c flv_read_header flv_read_packet解析
  5. 硬质合金牌号及切削刀片型号的表示方法
  6. 对称密码和公开密钥密码技术
  7. 【数学归纳法】【错位排序】Number Theory Special Training T4 derange 题解
  8. 中国新能源汽车行业竞争状况与产销规模预测报告2022版
  9. 如何解决PDF页面大小不一致的情况?
  10. 医学图像分割 基于深度学习的肝脏肿瘤分割 实战(二)