基于知识图谱的问答系统(Knowledge-based Question Answering,KBQA),这个领域的论文大多是基于 Freebase 的。

Freebase 作为典型的知识图谱,其采用结构化的数据形式(Wikipedia并不是)。Freebase 的内容主要源于 Wikipedia、NNDB、MusicBrainz 以及社会用户的贡献。该项目由 MetaWeb 公司在2005年启动,Google于2010年收购了该公司,并将 Freebase 作为Google知识图谱的核心部分。2016年8月,Google停止了对 Freebase 的维护,并将其整体迁移合并到 WikiData 项目中[1]。目前我知道的有以下几种方法获取到 Freebase 数据。

  1. Freebase Data Dump:Freebase 官网提供 N-Triple RDF格式(.nt文件)的数据压缩包的下载,整个压缩包30G,解压后300G+。下载后,可以用压缩软件解压,也可以通过编程工具(比如Java的GzipInputStream)边读取边解压。[2][3] (我并没有尝试这个方法)
  2. FB2M和FB5M:FB2M和FB5M是 Freebase 的两个子集,其中 FB2M 含有2M实体和5k实体关系,FB5M含5M实体和7k实体关系。CSDN上有这个两个文件的下载链接,其中使用 FB5M 还需要下载一个 FB5M 中 entity linke 到 entity name 的映射文件来将语料集的 link 替换掉[4](参考文章[4]中作者也提供了3个文件的下载链接,但可能过期)。下载之后三个文件都是 txt 文件,需要转换为 RDF 格式,文章后面会介绍如何转换为 RDF 格式并配合 Virtuoso 使用,我暂时只处理了 FB2M 数据,所以只说明 FB2M 数据的处理。
  3. FB15K和FB15K-237:FB15K 也是 Freebase 的子集,而FB15K-237 是 FB15K 的子集。这部分我暂时没有去了解,只提供一个下载链接Download FB15K-237 Knowledge Base Completion Dataset from Official Microsoft Download Center,和链接中对该数据集的一段描述:This dataset contains knowledge base relation triples and textual mentions of Freebase entity pairs, as used in the work published in (Toutanova and Chen CVSM-2015) and (Toutanova et al. Last published: October 30, 2015.

freebase的entity id到真实数据的映射 数据集

...
/m/01jzhl   Colin Pine
/m/01jzhl   Yaoming
/m/01jzhl   姚明
/m/01jzhl   Ming Yao
/m/01jzhl   Yow Ming
/m/01jzhl   Yáo Míng
/m/01jzhl   Yao ming
/m/01jzhl   Yao Zhiyuan
/m/01jzhl   Yao Meng
/m/01jzhl   Yoa ming
/m/01jzj2   Brown hydroboration
/m/01jzj2   Hydroboration-oxidation
/m/01jzj2   Hydroboration–oxidation
/m/01jzj2   Hydroboration
/m/01jzj2   Hydroboration-oxidation reaction
/m/01jzjh   Substitution boxes
/m/01jzjh   S-Box
/m/01jzjh   Sbox
/m/01jzjh   Cryptography/s-box
/m/01jzjh   S Box
/m/01jzjh   SBox
/m/01jzjh   S box
/m/01jzjh   S-boxes
/m/01jzjh   S-table
/m/01jzj_   Korn Ferry International
/m/01jzj_   Korn/Ferry International
/m/01jzkb   American Basketball League (1961-1963)
/m/01jzkb   American Basketball League 1961-63
/m/01jzkp   Neil Arthur
/m/01jzkp   Stephen Luscombe
/m/01jzl2   CAST-5
/m/01jzl2   CAST5
/m/01jzlw   Taxonomy of the carcharhiniformes
/m/01jzlw   Taxonomy of the Carcharhiniformes
/m/01jzlw   Shark taxonomy Order Carcharhiniformes
/m/01jzlw   List of species of the order Carcharhiniformes
/m/01jzlw   Ground sharks
/m/01jzlw   Whaler sharks
/m/01jzlw   Shark taxonomy Order Carcharhiniformes (cont.)
/m/01jzlw   Groundshark
/m/01jzm9   Hók-ciŭ
/m/01jzm9   Fujhou
/m/01jzm9   Fuzhou City
/m/01jzm9   Fuzhou, Fujian
/m/01jzm9   Hokchew
/m/01jzm9   Hockchew
/m/01jzm9   Fuh-Chau
/m/01jzm9   Fuchow
/m/01jzm9   福州
/m/01jzm9   Foochow
/m/01jzm9   Fu Zhou
/m/01jzm9   Fuhchau
/m/01jzm9   Foochow (disambiguation)
/m/01jzm9   Hock Chew
/m/01jzm9   Fúzhou
/m/01jzm9   Foo Chow
/m/01jzm9   福州市
/m/01jzm9   Fu-chou
/m/01jzm9   Fu zhou
/m/01jzm9   Fuzhou, China
/m/01jzm9   Fuzhou Municipality
/m/01jzm9   Fuchou
/m/01jzm9   Fuh Chau
/m/01jzm9   Fu-Chou
...



Freebase及其处理和导入数据库
Freebase Data Dump结构初探
Freebase Data Dump 结构初探(二)——浅析元信息
freebase的entity id到真实数据的映射 数据集
Freebase API (Deprecated)

数据集-知识图谱:FreeBase(通用知识图谱)【英文】相关推荐

  1. 通用知识图谱VS行业知识图谱

      众所周知,知识图谱是Google于2012年提出,用来优化搜索结果.经过多年的发展,知识图谱在人工智能的许多行业都拥有了成熟落地的应用.按照知识图谱的覆盖面来看,主要分为通用知识图谱与行业知识图谱 ...

  2. 垂直领域知识图谱_垂直知识图谱的构建与应用研究

    龙源期刊网 http://www.qikan.com.cn 垂直知识图谱的构建与应用研究 作者:阮彤 王梦婕 王昊奋 胡芳槐 来源:<知识管理论坛> 2016 年第 03 期 摘要: [ ...

  3. 从零学习知识图谱——01(知识图谱技术介绍)

    今年研一,导师给的大范围是知识图谱.从零开始学习知识图谱相关知识,内容大多为笔记和心得,仅供参考.欢迎各位大牛来指导. 知识图谱 (Knowledge Graph,KG) 以结构化的形式描述客观世界中 ...

  4. 图谱实战 | 京东商品图谱构建与实体对齐

    转载公众号 |  DataFunTalk 分享嘉宾:赵学敏博士 京东科技 编辑整理:蔡丽萍 TRS 出品平台:DataFunTalk 导读:在电商企业采购和运营过程中,如果要想掌握商品的实时价格等行情 ...

  5. 吐血整理!12种通用知识图谱项目简介

    作者:王楠 赵宏宇 蔡月 来源:大数据DT(ID:hzdashuju) 通用知识图谱大体可以分为百科知识图谱(Encyclopedia Knowledge Graph)和常识知识图谱(Common S ...

  6. 通用知识图谱的构建及在QQ浏览器的应用实践

    今天给大家分享腾讯QQ浏览器知识图谱团队荆宁先生所做的分享<通用知识图谱构建与应用.pdf>,本次分享在整体介绍知识图谱技术的基础上,将重点分享腾讯QQ浏览器团队在图谱构建和应用上的落地实 ...

  7. 知识图谱系列-2-知识图谱发展历程及其分类

    1. 知识图谱发展历程 知识图谱的发展可以从人工智能和语义网(注意语义网和语义网络是不同的)这两个领域进行追溯.在人工智能方面,人类致力于使计算机更智能,能够进行推理.分析.预测等高级思维活动.而知识 ...

  8. 知识图谱学习笔记之知识图谱中的知识分类

    知识图谱中的知识分类 事实知识 事实知识是关于某个特定实体的基本事实,如(山东富士苹果,产地,山东).事实知识是知识图谱中非常常见的知识类型.大部分的事实知识都是在描述实体的特定属性或关系,如&quo ...

  9. 【知识图谱】 | 《知识图谱——方法、实践与应用》阅读笔记

    <知识图谱--方法.实践与应用>的阅读笔记 知识图谱--方法.实践与应用 第1章 知识图谱概述 1.1 什么是知识图谱 1.2 知识图谱的发展历史 1.3 知识图谱的价值 1.4 国内外典 ...

  10. 知识图谱学习笔记-知识图谱价值和发展历程

    一:知识图谱的价值: 1.辅助搜索 传统搜索引擎依靠网页之间的超链接实现网页的搜索,而语义搜索是直接对事物进行搜索,如人物.机构.地点等.这些事物可能来自文本.图片.视频.音频.IoT 设备等各种信息 ...

最新文章

  1. typora行内公式怎么显示不了,怎么办?
  2. 23 | MySQL是怎么保证数据不丢的?
  3. 如何理解signal函数声明
  4. 倒计时2天!年末最大AI开发者盛典来袭,快来报名
  5. java设计模式—单例模式
  6. oracle10g 操作系统,各版本操作系统ORACLE 10g 下载(包括windows和linux)
  7. C++算法学习(力扣:1269. 停在原地的方案数)
  8. html和css实现时间表,前端 CSS : 6# 纯 CSS 实现时间线
  9. 人群密度分析算法调研
  10. swift学习之数组、字典和字符串
  11. MacBookPro阻止电脑自动下载更新
  12. 给你入冬后的第一杯奶茶
  13. STARK STARK_LT 复现(2021)
  14. 云计算前景如何?大专学历学习云计算怎么样?
  15. 大学生为什么要学Linux?Linux有什么优点?
  16. 【超融合】818超融合发展经历了哪几个阶段!
  17. hive求某天是当年第几周形如yyyyww
  18. java多线程之Callable接口
  19. 14.刚体组件Rigidbody
  20. H5企业网站模板:蓝绿过渡色功能菜单齐全企业网站模板

热门文章

  1. 面试阿里数据研发岗,无缘三面,谈谈面经
  2. 嵌套iframe页面做打印去掉页眉页脚
  3. 数据中台POC演示流程
  4. 母婴行业竟也可以免费送?两种案例让你全面了解新的赚钱模式!
  5. Unity Shader-反射效果(CubeMap,Reflection Probe,Planar Reflection,Screen Space Reflection)
  6. 在VC6.0下设置Unicode编译环境
  7. 数据可视化——柱状图
  8. 编程高手与IT民工的区别在哪?
  9. 使用httpclient调用url出现错误Illegal character in scheme name at index 0解决方案
  10. “豫”见超融合,私有云浪潮开启新一线