KnowIME: A System to Construct a Knowledge Graph for Intelligent Manufacturing Equipment

构建智能制造设备知识图谱的系统


系统架构

显示了构建KnowIME信息系统的架构图。

智能制造设备的非结构化数据(例如文本,图像)和结构化数据(例如数值数据)是从互联网,百度百科以及相关的智能制造网站获得的。

数据与关系数据一起保存到Redis数据库中。

从多个来源(例如数据库和Hadoop File System)中提取知识实体和数据关系。

提取的实体和关系将保存到特殊格式的文件中,并通过APOC工具和load csv文件导入到Neo4j非关系数据库中。

最后,为了提高用户查询知识的效率,首先完成了图数据库中实体与关系之间的知识存储,并尽可能优化了图结构。


建筑KG的技术

如图所示提出的智能制造设备信息系统主要包括两个方面,即制造设备领域中的实体提取和设备领域中实体之间的关系提取。

数据准备阶段是关于获取数据和清洁数据。

然后,构造知识单元的操作主要包括文本中的命名实体信息和单元实体之间的关系提取。

结构化显示是使用数据可视化技术在提取的实体和关系之间进行可视化的过程。

最后,最短路径算法用于计算图节点的最接近距离,以推荐相关设备信息并为用户提供搜索服务。


文本数据的预处理主要使用NLP的常用方法,包括文本的提取和词性标记。

对于从网页抓取的文本数据,通过分词,停用词的去除和词性标记的处理,获得了关系提取所需的句子集。


G成为无向图 ,V 是一组节点,E 是一组无向边。

V 对应于随机变量Y_v,其范围是可能的标记集{y}。
p 表示状态转换概率。 ω 〜 v 表示图G上的相邻点。

其含义是,当一个随机过程在给定现在状态及所有过去状态情况下,其未来状态的条件概率分布仅依赖于当前状态;换句话说,在给定现在状态时,它与过去状态(即该过程的历史路径)是条件独立的,那么此随机过程即具有马尔可夫性质。


如图所示,图G的结构可以是任意的,只要在标记序列上方描述了某些条件独立性即可。 通过对序列进行建模,可以形成简单的普通链结构图,并且节点对应于标记序列中的元素。


tj(yi-1,yi,X,i)是转换特征函数,表示观察到的序列X的标记序列在i到i-1位置的转移概率。sk(yi,X,i)是一个状态特征函数,表示对位置为i的观察序列X进行标记的概率。βj和µk是tj和sk的权重。

观察到的序列代表训练样本中特征的分布。

i代表X的维数或特征。

当yi-1和yi满足转移条件且Xi是特定词时,转移特征函数取1; 否则为0。


为了便于描述,状态功能可以编写如下:

如果转换特征函数和状态特征函数都抽象为f(x),则:

z(x) 是归一化因子,并且 βj代表相应的系数。


中文句子以多种方式表达。为了更充分地准备提取关系,首先进行以​​下定义:

根据以上定义,本文通过语料库分析,自然语言处理和汉语语法知识介绍以下提取规则:

规则1假设中文句子符合“(设备实体,特征,属性值)”模式。如图所示,O(NN), F (NN / VV),N(CD)分别表示实体,要素和属性值,并且该关系提取的路径没有多余的选项。根据汉语语法,除量词,名词和动词外,其他所有单词均被删除,其余部分根据其在原始句子中的位置进行排序,并提取结果。


规则2如果文本中的句子符合“((实体1,实体2,…,实体i),特征值,属性值)”模式,则谓词前面的介词机构指向主题。

如图所示,Ø1个 (NN), Ø2 (NN), Ø3 (NN), Ø4 (NN)分别代表实体1,实体2,实体3,实体4。和F (NN / VV), ñ (CD)分别表示特征和属性值。

使用分词工具进行分词时,谓词之前的部分可能会分为多个名词,这可能是特征对象的一部分。

同时,对应于多个实体之间的关系,多个实体以并排关系位于特征词的前面。

因此,提取特征对象候选集合的结果是从“(实体1,实体2,…,实体n)”中依次选择几个组合,整个实体关系提取为“(实体组合选项,特征词,属性值”)。

主要使用语法分析的功能来手动提取制造设备实体之间的属性关系。


案例分析

从智能制造的新闻语料库中,我们使用了上面提出的无监督语法分析方法来获取相关关系,如图所示。

由于适合提取设备实体之间关系的语料库数据非常小,因此该设备的新数据有偏斜,并且只有与表类似的简单关系可以获得。在构建过程中,还需要人为地添加一些设备信息的关联数据,并根据附加信息完成设备KG信息。


entity1{Id: String, product_Name: String, company: String, product_Price: String, product_place: String}.

车床子类设备的KG信息,绿色圆圈代表子类设备,蓝色圆圈代表父类。


设备KG检索的整个过程



KnowIME: A System to Construct a Knowledge Graph for Intelligent Manufacturing Equipment-学习笔记相关推荐

  1. Improving Conversational Recommender System by Pretraining Billion-scale Knowledge Graph论文笔记

    原文章:Improving Conversational Recommender System by Pretraining Billion-scale Knowledge Graph (ICDE ' ...

  2. 学习Knowledge Graph Embedding Based Question Answering代码笔记

    前言 最近被导师安排学习一下[Knowledge Graph Embedding Based Question Answering] 这篇paper,这篇paper的重点在于运用了Knowledge ...

  3. SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS 论文/GCN学习笔记

    1 前置知识:卷积与CNN 该内容在论文中并没有涉及,但理解卷积和CNN对于GCN的理解有帮助,因为GCN是将CNN推广到新的数据结构:graph上面. 1.1与1.2的内容均来自视频:https:/ ...

  4. RelExt: Relation Extraction using Deep Learning approaches for Cybersecurity Knowledge Graph 阅读笔记

    RelExt: Relation Extraction using Deep Learning approaches for Cybersecurity Knowledge Graph Improve ...

  5. [转发]知识图谱 (Knowledge Graph) 专知 荟萃

    知识图谱 (Knowledge Graph) 专知 荟萃 入门学习 大规模知识图谱技术 王昊奋 华东理工大学 [http://history.ccf.org.cn/sites/ccf/xhdtnry. ...

  6. HAKE笔记:Learning Hierarchy-Aware Knowledge Graph Embeddings for Link Prediction

    原文:Learning Hierarchy-Aware Knowledge Graph Embeddings for Link Prediction 代码:https://github.com/MIR ...

  7. 论文浅尝 | DI刊发的那些有关Knowledge Graph的论文

    本文转载自公众号:数据智能英文刊 知识图谱被称为人工智能的基石,它的前身是语义网,由谷歌在2012年率先提出,用于改善自身的搜索业务.Data Intelligence执行主编.东南大学计算机科学与技 ...

  8. Learning Hierarchy-Aware Knowledge Graph Embeddings for Link Prediction论文阅读笔记

    我的博客链接 0. 前言 1. 作者试图解决什么问题? 作者想在KGE中对语义层级(semantic hierarchies)进行建模. 2. 这篇论文的关键元素是什么? semantic hiera ...

  9. RKGE Recurrent Knowledge Graph Embedding for Effective Recommendation 论文

    Paper-RKGE [ Recurrent Knowledge Graph Embedding for Effective Recommendation ] Abstract 关于KG应用于推荐,现 ...

最新文章

  1. php7 redis长连接,php使用redis长连接有哪些步骤
  2. 校内训练赛题解第三篇
  3. java中用数组模拟的酒店管理系统
  4. Win8下怎样安装Win7 or Win7下怎样安装win8?
  5. 《从零开始学ASP.NET CORE MVC》课程介绍
  6. 阿里云java mysql环境_阿里云搭建centos java mysql nginx环境
  7. js 节点和checkbox 使用案例
  8. 又一款程序员摸鱼神器来了?上班也可以在VSCode看股票 基金实时数据
  9. 火山PC加载DLL窗口案例教程
  10. mysql 5.7.26卸载_MySQL 5.7.26安装与卸载
  11. jQuery 事件冒泡
  12. Julia数据可视化:Plots.jl包的使用
  13. Python学习:垃圾回收机制
  14. 面试中的着装与举止--Java面试
  15. 数字孪生使用云流化的优势
  16. Table '表名' doesn't exist
  17. python元组可以排序吗,关于python:如何对列表/元组进行排序(list/tuple)?
  18. vs2013(所有版本)-产品密钥
  19. MaxCompute实践之路(三) -- Java对接MaxCompute
  20. 绘图---带你熟练操作PS工具栏

热门文章

  1. Machine Learning on Spark——统计基础(二)
  2. 解锁redis锁的正确姿势
  3. 面试题:谈谈你对hibernate的理解
  4. 新概念英语(1-11)Is this your shirt ?
  5. Android 蹲坑的疑难杂症集锦一
  6. linux下GPRS模块的应用程序
  7. homebrew install php53
  8. 解决PHP生成校验码时“图像因其本身有错无法显示”的错误
  9. Navicat for MySQL - 破解
  10. Angularjs1.x 项目结构