1 . 定义

知识图谱是由一些相互连接的实体和它们的属性构成的,是用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。

用来揭示实体之间关系的语义网络

  • 信息是指外部的客观事实。举例:这里有一瓶水,它现在是7°。
  • 知识是对外部客观规律的归纳和总结。举例:水在零度的时候会结冰。

三元组:实体entity,实体关系relation,实体entity

2. 几个过程

原始数据类型一般来说有三类(也是互联网上的三类原始数据):

  • 结构化数据(Structed Data):如关系数据库
  • 半结构化数据(Semi-Structed Data):如XML、JSON、百科
  • 非结构化数据(UnStructed Data):如图片、音频、视频、文本

要做好KG要综合利用好KR、NLP、Web、ML、DB等多方面的方法和技术。

2.1 知识抽取

信息抽取:从各种类型的半结构化、非结构化的数据源中提取出实体、属性以及实体间的相互关系,在此基础上形成本体化的知识表达;

2.1.1 结构化数据处理

针对结构化数据,通常是关系型数据库的数据,数据结构清晰,把关系型数据库中的数据转换为RDF数据(linked data),普遍采用的技术是D2R技术。

2.1.2 半结构化数据处理

半结构化数据:具有一定的数据结构,但需要进一步提取整理的数据。
eg. 百科的数据,网页中的数据等。

包装器是一个能够将数据从HTML网页中抽取出来,并且将它们还原为结构化的数据的软件程序。网页数据输入到包装器中,通过包装器的处理,输出为我们需要的信息。

2.1.3 非结构化数据处理

对于非结构化的文本数据,我们抽取的知识包括实体、关系、属性。

  • 实体抽取
    也称为命名实体识别,此处的实体包括概念,人物,组织,地名,时间等等。
  • 关系抽取
    实体和实体之间的关系,也是文本中的重要知识,需要采用一定的技术手段将关系信息提取出来。
  • 属性抽取
    也就是实体的属性信息,和关系比较类似,关系反映实体的外部联系,属性体现实体的内部特征。

2.2 知识融合

知识融合,就是将多个知识库中的知识进行整合,形成一个知识库的过程,在获得新知识之后,需要对其进行整合,以消除矛盾和歧义,比如某些实体可能有多种表达,某个特定称谓也许对应于多个不同的实体等;形成高质量的知识库。

知识融合的目的就是将不同知识库对实体的描述进行整合,从而获得实体的完整描述。主要包括:实体对齐,也包括关系对齐,属性对齐,可以通过相似度计算,聚合,聚类等技术来实现。

2.3 数据模型构建

知识图谱的数据=数据模型+具体数据
数据模型: 知识图谱的数据组织框架

2.4 知识推理

对于经过融合的新知识,进一步挖掘隐含的知识。
知识推理,根据已有的数据模型和数据,依据推理规则,获取新的知识或者结论,新的知识或结论应该是满足语义的。

eg. 比如实体的分类包含关系,一个电脑椅是椅子,椅子是家具,可以说,一个电脑椅是家具。常识规则的推理,一个男人的孩子是A,一个女人的孩子是A,可以知道,这个男人和女人是配偶。

2.5 质量评估

对最后的结果数据进行评估,将合格的数据放入知识图谱中。

eg. 对于公共领域的知识图谱,知识的获取采用了众包的方法,对于同一个知识点,可能会有很多人来完成,如果这个知识点只有一个答案,可以采用的一种策略是,将多人的标注结果进行比较,取投票多的结果作为最终的结果。

【参考】

[1] 知识图谱入门 (一) 知识图谱与语义技术概览, Pelhans, csdn

知识图谱 (1)基本概念相关推荐

  1. 【知识图谱】知识图谱的基础概念与构建流程

    目录 1.引言 2.知识图谱的定义 3.知识图谱的架构 3.1 知识图谱的逻辑结构 3.2 知识图谱的体系架构 4.代表性知识图谱库 5.知识图谱构建的关键技术 5.1 知识提取 5.2 知识表示 5 ...

  2. 知识图谱发展的三个时期以及事理图谱概念辨析

    一.知识图谱发展三个周期 知识图谱,从2012年谷歌正式将这一概念应用到工业界之后,到现在已经逐步走过了将近7年的时间,在这七年的时间里,知识图谱逐步经历了从概念兴起.概念泛化.技术挣扎与落地尴尬三个 ...

  3. dbpedia知识图谱java_一种基于DBpedia的水务领域概念知识图谱构建方法与流程

    本发明涉及的是领域知识图谱构建技术领域,涉及到一种基于DBpedia的水务领域概念知识图谱构建方法,特别涉及到一种基于Jaccard相似度算法与随机游走相似度算法结合的协同过滤模型框架,用于补全概念模 ...

  4. 关于知识图谱上下级概念建设的一点想法

      对知识图谱有所了解的人,都知道知识图谱是对知识的整理,以点和边的形式呈现,属于人工智能中的"符号主义"流派.虽然知识图谱可以清晰地告诉我们各个知识点之间的关联和区别,但我们还是 ...

  5. 你需要学好知识图谱——用AI技术连接世界

    立即参团 原价 ¥899.00 50人以上  ¥499.00 100人以上  ¥399.00 点击文末阅读原文,立即参团 <知识图谱>第一期  课程简介: 本次的知识图谱课程主要包括三大部 ...

  6. 综述 | 三大路径,一文总览知识图谱融合预训练模型的研究进展

    当前,预训练模型已是AI领域较为成熟的一项技术,但由于基于神经网络架构的模型本身不具有常识能力,在一些涉及逻辑推理和认知的任务上力有不逮. 近年来,知识图谱越来越受到人们的关注,知识图谱旨在提供一种复 ...

  7. 让静态知识动起来:从知识图谱到事理图谱

    2021-03-12 18:42 导语:从是什么到为什么. 作者 | AI科技评论 在社交网络中,有这样一条著名的"六度分隔理论": "最多通过五个人,你就能够认识世界上 ...

  8. 新手探索NLP(十一)——知识图谱

    转载自https://blog.csdn.net/JH_Zhai/article/details/79919604 知识图谱 根据 W3C的解释,语义网络是一张数据构成的网络,语义网络技术向用户提供的 ...

  9. 【知识图谱】如何构建知识体系:知识图谱搭建的第一步

    互联网时代,人类在与自然和社会的交互中生产了异常庞大的数据,这些数据中包含了大量描述自然界和人类社会客观规律有用信息.如何将这些信息有效组织起来,进行结构化的存储,就是知识图谱的内容. 知识图谱的难点 ...

最新文章

  1. 【HDU/POJ/ZOJ】Calling Extraterrestrial Intelligence Again (素数打表模板)
  2. mysql严重查询速度的问题一则
  3. java蓝桥杯凑算是,第七届蓝桥杯JAVA B组真题解析-凑算式(第三题)
  4. 构造方法,this,super关键字
  5. Python 3.9,来了!
  6. WCF技术剖析之二十七: 如何将一个服务发布成WSDL[基于HTTP-GET的实现](提供模拟程序)...
  7. 二、MyBatis系列:全局配置文件
  8. 【面试】求数组子序列的最大和
  9. 做python自动化得时候怎么添加断言_python接口自动化(二十四)--unittest断言——中(详解)...
  10. class文件反编译成java文件
  11. 2018/03/28更新 日记
  12. AntV G2 Tooltip
  13. java1.8 Lambda拉姆达表达式深入探究
  14. Web UI自动化中使用cookies登录
  15. 全套机密PS技术,你在学校里十二年,也学不到这么多
  16. Docker所在目录以及查询正在运行容器的所在位置
  17. WPF 实现label换行
  18. 一名普通22届本科毕业生|前端程序员|22年年终总结
  19. oracle简单查询
  20. 计算机网络自顶向下方法第四章笔记

热门文章

  1. Python 命令pip install pygame安装报错
  2. vue 跳转页面传参的时候参数值为undefined的解决方法
  3. do while循环语句_流程控制之循环语句【while循环语句】
  4. JAVA项目实训struts2_Java Web项目搭建过程记录(struts2)
  5. 无限乱斗机器人ap出装_LOL:无限火力仅剩4天,这5个英雄一定要尝试!
  6. ML:基于自定义数据集利用Logistic、梯度下降算法GD、LoR逻辑回归、Perceptron感知器、SVM支持向量机、LDA线性判别分析算法进行二分类预测(决策边界可视化)
  7. DayDayUp之Job:牛客网—算法工程师—剑指offer之66道在线编程(解决思路及其代码)——21~40
  8. Dataset之AllstateClaimsSeverity:AllstateClaimsSeverity数据集(Kaggle2016竞赛)的简介、下载、案例应用之详细攻略
  9. DayDayUp:微软最有价值专家MVP申请表格、准备条件、流程等详细攻略
  10. pycharm专业版-2017.3.3 安装+anaconda3-2019.03-windows