学习内容

小象学院 b站 第二章
【其实后面的方法学习只是一个框架式的学习,并不明白具体的操作】

第二部 典型知识库项目简介

CYC(读音: 赛克)

  • CYC: 1984年由Douglas Lenat开始创建,最初的目标是建立人类最大的常识知识库。该知识库主要由术语Terms和断言Assertions组成。

  • Cyc的主要特点是基于形式化的知识表示方法来刻画知识。形式化的优势是可以支持复杂的推理。但过于形式化也导致知识库的扩展性和应用的灵活性不够。Cyc提供开放版本的OpenCyc

Wordnet

  • WordNet是最著名的词典(lexical)知识库,主要用于词义消歧,1985年提出的。

  • WordNet主要定义了名词、动词、形容词和副词之间的语义关系。 例如名词之间的上下位关系(如: 猫科动物是猫的上位词),动词之间的蕴涵关系(如:打鼾蕴含着睡眠)等

  • WordNet已经包含超过了15万个词和20万个语义关系。

ConceptNet

  • ConceptNet是常识知识库。来源于OMCS项目。1999年创立
  • ConceptNet主要依靠互联网众包、专家创建和游戏三种方法来构建。新版本导入了大量开放的结构化数据,如DBPedia、WordNetdeng
  • ConceptNet知识库以三元组形式的关系型知识构成。ConceptNet5版本已经包含有2800万关系描述。与Cyc相比,ConceptNet采用了非形式化、更加接近自然语言的描述,而不是像Cyc那样采用形式化的谓词逻辑
  • 与链接数据和谷歌知识图谱相比,ConceptNet比较侧重于词与词之间的关系。从这个角度看,ConceptNet更加接近于WordNet,但是又比WordNet包含的关系多。此外,ConceptNet完全免费开放,并支持多种语言。

Freebase


三元组:我们理解为主谓宾

Wikidata

DBPedia

  • DBPedia是早期的语义网项目。DBPedia意指数据库版本的Wikipedia,是从Wikipedia抽取出来的链接数据集。DBPedia采用了一个较为严格的本体,包含人、地点、音乐、电影、组织机构、物种、疾病等类定义
  • 此外,DBPedia还与Freebase、OpenCYC、Bio2RDF等多个数据集建立了数据链接。 DBPedia采用RDF语义数据模型,总共包含30亿RDF三元组。

三元组:我们理解为主谓宾

YAGO

链接

我们还添加了各种时间关系,比如奥巴马是多少年任期的; 鹿晗和关晓彤是多少年在一起的。

BabelNet

  • BabelNet是类似于WordNet的多语言词典知识库。BabelNet的目标是解决WordNet在非英语语种中数据缺乏的问题。BabelNet采用的方法是将WordNet词典与Wikipedia百科集成
  • 首先建立WordNet中的词与Wikipedia的页面标题的映射,然后利用Wikipedia中的多语言链接,再辅以机器翻译技术,来给WordNet增加多种语言的词汇
  • BabelNet3.7包含了271中语言,1400万同义词组,36,4万词语关系和3.8亿从Wikipedia中抽取的链接关系,总计超过19亿RDF三元组。继承了上面两个数据库的优点,构建了目前最大规模的多语言词典知识库。
    我们可以利用同义词来重构搜索条件

NELL


这里是自动在web上抽取三元组知识;但是需要知识抽取(bootstrap)来进行引导。

Concept Graph

  • Concept Graph是以概念层次体系为中心的知识图谱。与Freebase等知识图谱不同,Concept Graph以概念定义和概念之间的IsA关系为主
  • 给定一个概念如“Microsoft”,Concept Graph返回一组与“微软”有ISA关系概念组,如“Company”,“Software Company”,这被称为概念化“Conceptualization”
  • Concept Graph可以用于短文本理解和语义消歧。 如“工程师在吃苹果”,苹果指的是苹果还是苹果公司。

OpenKG:中文知识图谱资源库

Zhishi.me

英文很多,中文很少。 包括百度百科
实体抽取,关系抽取 --》 知识抽取

我们获取知识后再进行整合,进行互补。

cnSchema:开放的中文知识图谱Schema

可以自行访问

知识图谱入门视频(二)相关推荐

  1. 知识图谱入门视频(三)

    学习内容 小象学院 b站 第三章 [其实后面的方法学习只是一个框架式的学习,并不明白具体的操作] 链接 问题: 知识图谱究竟是什么? 可以看看开放知识图谱 其实就是将我们的语言拆分转换为符号表达,之后 ...

  2. 知识图谱入门视频(一)

    学习内容: 知识图谱导论 陈华钧 浙江大学计算机科学与技术学院 教授 小象学院 哔哩哔哩 第一章 [其实后面的方法学习只是一个框架式的学习,并不明白具体的操作] 1. 什么是知识图谱? 知识图谱是一个 ...

  3. 知识图谱入门视频(四)

    学习内容 小象学院 b站 问题 本体和实体的区别? 苹果公司是一个科技公司,那么苹果公司就是一个实体,它所对应的科技公司就是本体概念. 分布式表示和分布式存储 前者是将语义连续化,后者则是一个存不下: ...

  4. 知识图谱入门 【九】- 知识问答

    知识图谱入门 [一]- 认识图谱技术 知识图谱入门 [二]- 知识表示与知识建模 知识图谱入门 [三]- 知识抽取 知识图谱入门 [四]- 知识挖掘 知识图谱入门 [五]- 知识存储 知识图谱入门 [ ...

  5. 知识图谱入门 【八】- 语义搜索

    知识图谱入门 [一]- 认识图谱技术 知识图谱入门 [二]- 知识表示与知识建模 知识图谱入门 [三]- 知识抽取 知识图谱入门 [四]- 知识挖掘 知识图谱入门 [五]- 知识存储 知识图谱入门 [ ...

  6. 知识图谱入门 【一】- 认识图谱技术

    知识图谱入门 [一]- 认识图谱技术 知识图谱入门 [二]- 知识表示与知识建模 知识图谱入门 [三]- 知识抽取 知识图谱入门 [四]- 知识挖掘 知识图谱入门 [五]- 知识存储 知识图谱入门 [ ...

  7. 知识图谱入门学习笔记(二)-知识表示

    目录 1 知识表示的概念 1.1 知识表示方法 1.2 知识表示的分类观点 1.3 知识表示的发展 2.1 语义网络 2.2 产生式系统 2.3 框架系统(Frame Systems) 2.4概念图( ...

  8. 知识图谱入门2-2:用户输入->知识库的查询语句

    注:欢迎关注datawhale:https://datawhale.club/ 系列: 知识图谱入门一:知识图谱介绍 知识图谱入门2-1:实践--基于医疗知识图谱的问答系统 知识图谱入门2-2:用户输 ...

  9. 知识图谱入门2-1:实践——基于医疗知识图谱的问答系统

    注:欢迎关注datawhale:https://datawhale.club/ 系列: 知识图谱入门一:知识图谱介绍 知识图谱入门2-1:实践--基于医疗知识图谱的问答系统 知识图谱入门2-2:用户输 ...

最新文章

  1. 在Mybatis3开发中与配置相关的7点体会
  2. 苹果如果无法弹出⏏️
  3. python 可视化饼图_Python可视化学习(饼状图,坐标系...)
  4. C# 重写WndProc及发送消息
  5. GPU Gems1 - 8 衍射的模拟
  6. SpringBoot2整合Activiti6工作流框架 源码
  7. linux什么用户什么任务,linux任务里的1 和2是什么意思
  8. 用MATLAB结合四种方法搜寻罗马尼亚度假问题
  9. mysql面试常用命令_面试之MySQL基本命令
  10. 微软发布Sample Browser for Windows 8版:5000示例代码,触手可及
  11. function与感叹号
  12. centos7+mysql5.7二进制安装
  13. 读书笔记《程序员修炼之道》
  14. 拓端tecdat|R语言分位数回归预测筛选有上升潜力的股票
  15. 干货| 364套各类风格毕业设计答辩PPT模板~
  16. 小米便签类间关系图绘制方法
  17. 1 年原创 150+ 篇,这位前阿里 P9 牛批!
  18. 51单片机按下按键数码管加一
  19. 论文笔记:DeepReID: Deep Filter Pairing Neural Network for Person Re-Identification
  20. 三种页面置换算法(详解)

热门文章

  1. C#通过修改注册表改变IE默认选项
  2. Arch Linux下打不开gnome-shell
  3. 在XML文件中定义动画(1)
  4. .NET 动态脚本语言Script.NET系列文章汇总 非常精彩的应用举例
  5. 基于UDP高性能传输协议UDT
  6. 在腾讯做嵌入式是怎么样的
  7. LinuxGPIO操作和MTK平台GPIO
  8. Linux shell sed awk
  9. windows xp 下的putty不能使用小键盘的问题
  10. linux c语言内核函数,2014-1-5_linux内核学习(1)_C语言基础