装备保障性验证知识图谱构建方法研究-学习笔记
装备保障性验证知识图谱构建方法研究
领域知识图谱构建
在逻辑层面,知识图谱通常可以划分为数据层和模式层两个层次。数据层主要是将领域中的多源异构数据转换为三元组的形式,通过一系列三元组表达领域知识或者常识知识,比如用(实体1,关系,实体2)、(实体、属性,属性值)这样的三元 组来表达事实,从而实现对知识进行存储。模式层是在数据层的基础上构建的,领域知识图谱构建过程通常通过构建领域本体(Ontology)来规范数据层。本体规范了领域核心结构,具有较强的结构层次,有效减少冗余。
由于垂直领域知识图谱对领域知识准确性以及领域知识之间深层次关系要求较高,因此一般采用自顶向下构建方式。
虽然垂直领域知识图谱一般面向不同的特定领域和不同的数据模式,现在没有统一的构建标准和规范。但是一般构建过程可以分为六个阶段,即知识建模、知识存储、知识抽取、知识融合、知识计算、知识应用。
面向装备保障性验证的知识图谱构建
装备保障性验证知识图谱构建技术流程。
D2R将关系数据库中的数据映射到RDF(资源描述框架,表示为三元组形式,RDF本质是一种数据模型(Data Model),RDF假设所有语义都可以以三元组形式进行表示,复杂语义可以由n个三元 组组合表示,它提供了一种统一的描述实体、概念、属性的标准,形式上表示为SPO三元组形式)中。
KBP(知识库填充,关系抽取语料)KBP 评测由文本分析会议主办,其目标是开发和评估从非结构化文本中获取知识填充知识库的技术。KBP 评测覆盖了知识库填充的独立子任务以及被称为“冷启动”的端到端知识库构建任务。
采用应用最为广泛的OWA形式化定义进行装备保障性验证领域本体建模。
C是领域概念集; A是概念的属性集;R 是关系集;A 是每个关系属性集; H表示概念层次;X 表示公理集。
基于本体的保障性验证系统分析的核心在于:在OWA形式化规范下逐层确定装备保障系统概念和概念之间的关系。 如此逐层分析,直至确定研究目的下所定义的最小细粒度概念。 在概念分析的过程中会逐层体现所需建立的模型。
多源异构装备保障性实体抽取和实体关系构建包括装备保障性验证知识抽取、关系链接、关系推理等。
保障性验证领域知识的来源包括装备保障本体库、基础装备保障性数据、与装备保障性相关的国军标、装备保障性相关的科研项目成果(报告、模型)、试验基地的历史数据等。可从中提取装备保障性验证相关概念、装备保障性验证实体、装备保障性验证相关属性、语义关系、空间关系、时间关系。
时间关系主要描述在装备寿命周期各阶段装备保障性验证所处的不同状态以及任务属性。对时间关系的形式化描述可分为两类,
一类是装备保障性验证事件、过程等实体之间的时变关系描述,如事件:“在装备设计阶段,装备设计人员需要考虑加油口盖消沫功能”可对抽取得到的三元组“设计人—设计—加油口盖消沫功能”添加时间标签拓展为四元组,用来描述时间;
第二类是空间特征的时间变化属性。可用于实体和关系的更新,如装备进行长途奔袭过程中,装备的空间属性值以及装备状态属性值是随时间而变化的,这也是未来构建动态知识图谱的时间轴基础。
经过知识抽取得到的知识可以划分为本体层(抽象知识)和实例层(具体事实)。
虽然通过本体建模的方式构 建了装备保障性验证领域的本体模型,但是事实上,无法构建出一个能够包含全方面的统一本体,因为面向不同应用场景以及面向不同的用户使得不同本体之间有不同侧重点和差异。大量实例之间也存在异构性问题。
由于知识之间可能存在冗余和错误的情况,需要通过知识融合来解决本体层和实例层异构问题,以提高知识质量和精度。
如图描述了本体映射的基本过程。
基于术语:自然语言处理技术,比较映射对象之间的相似度
基于术语的本体映射
基于字符串
(1)规范化
(2)相似度量方法:
汉明距离:计算字符出现位置的不同
子串相似度
编辑距离:修改其中一个使之与另一个相同所需的最小操作代价
路径距离:考虑父概念
基于规则的实例匹配
基于EM算法的半监督学习框架----自动寻找实例匹配规则
该框架以迭代的方式自动发现匹配规则,逐步提高匹配规则集的质量,再利用跟新后的规则集来寻找高质量的匹配对。
在规范字符串的基础上,通过度量字符串的相似程度判断本体的映射关系,可以使用以下四种方法度量字符串相似度。
导入的任意两个本体字符s和t。
若存在两个字符串p和q使得s=p+t+q或t=p+s+q,则称t是s的子串或s是t的子串,令x为s和t的最大公共子串,则s和t的子串相似度为:
若给定一个字符串操作集合op和一个代价函数w,对于任意一对字符串s和t,存在将s转化为t的操作序列集合,则两字符串的编辑距离为:
若给定两个字符串序列,则路径距离计算,是某字符串度量函数
装备保障性验证知识图谱应用
装备保障性验证知识图谱构建方法研究-学习笔记相关推荐
- 知识图谱应用——煤矿安全知识图谱构建技术研究学习
一.研究背景 煤矿安全领域存在着结构化.半结构化以及非结构化等不同种类的数据格式,不同的存储及关联方式,导致煤矿安全领域数据呈现海量离散低效的特点,数据无法被有效地运用起来.构建一个逻辑清晰.覆盖范围 ...
- 技术动态 | 知识图谱构建的研究已走入下半场,但大规模落地应用仍需时间
本文转载自公众号:AI前线. 作者 | 李冬梅 采访嘉宾 | 唐杰 知识图谱是近年来人工智能技术蓬勃发展的核心驱动力之一,已广泛应用在金融.电商.医疗.政务等众多领域,经过短短几年的发展,热度依旧不减 ...
- dbpedia知识图谱java_一种基于DBpedia的水务领域概念知识图谱构建方法与流程
本发明涉及的是领域知识图谱构建技术领域,涉及到一种基于DBpedia的水务领域概念知识图谱构建方法,特别涉及到一种基于Jaccard相似度算法与随机游走相似度算法结合的协同过滤模型框架,用于补全概念模 ...
- 基于迁移学习的旋转机械故障诊断方法研究学习笔记
基于迁移学习的旋转机械故障诊断方法研究学习笔记 现在大一点的神经网络模型也要求数据量的足够大,但是对于小样本的数据,有一些神经网络模型也能够处理的很好 2. 这是现在神经网络也要求的数据最好能够独立同 ...
- 年末巨制:知识图谱嵌入方法研究总结
泽宇对自己的研究方向也就是知识图谱嵌入(KG Embedding)技术进行了总结,并制作了一套slides,力求让大家只看slides就可以理解并掌握知识图谱嵌入的相关知识和最新研究情况,包括知识图谱 ...
- 《知识图谱》赵军 学习笔记
知识图谱读书笔记 文章目录 知识图谱读书笔记 一. 概述 1.1 什么是知识图谱 1.2 知识图谱发展历程 1.3 知识图谱类型 1.4 知识图谱生命周期 知识体系构建 知识获取 知识融合 知识存储 ...
- 知识图谱介绍-我的学习笔记
近两年来,随着Linking Open Data等项目的全面展开,语义Web数据源的数量激增,大量RDF数据被发布.互联网正从仅包含网页和网页之间超链接的文档万维网(Document Web)转变成包 ...
- “高效的隐私保护的张量分解方法研究”学习笔记(上)
高效的隐私保护的张量分解方法研究 张量理论基础 张量分解 CP分解 TUCKER分解 Bi-Lanczos 算法 张量链分解 同态加密相关基础 这个笔记是学习张荣皓的"高效的隐私保护的张量分 ...
- 虚拟专题:知识图谱 | 流程工业控制系统的知识图谱构建
来源:智能科学与技术学报 流程工业控制系统的知识图谱构建 牟天昊1, 李少远1,2 1 上海交通大学电子信息与电气工程学院 2 上海交通大学系统控制与信息处理教育部重点实验室 摘要:近年来,工业控制系 ...
最新文章
- mysql 4.1.10_Mysql4.1.10初级解读
- android ndk 多线程mk,NDK开发之Android.mk文件编写
- 守卫者的挑战(guard)
- 228. Summary Ranges
- SDM For Face Alignment 流程介绍及Matlab代码实现之训练篇
- mysqldump文件中有SET @@SESSION.SQL_LOG_BIN= 0;解决方法
- [深度学习-实践]CycleGAN的入门例子-Tensorflow2.1-keras
- javascript 同时下载多个文件
- 数据挖掘概念与技术_第三版_课后习题
- Jquery监听input回车事件
- ODL(C版本)安装过程
- mysql字段提取函数_MySQL 字符串截取函数
- alisoft 开放旺旺SDK,我也来凑合一下
- 电脑无法连接WiFi,一直显示无法连接此网络
- 题解 [LuoguP3426][POI2005]SZA-Template
- 爬虫框架Scrapy(西瓜皮)
- python之正弦图
- OBS源码分析--视频采集显示
- Gustafson定律
- Maya绑定的基础属性介绍