数据集-知识图谱:FreeBase(通用知识图谱)【英文】
基于知识图谱的问答系统(Knowledge-based Question Answering,KBQA),这个领域的论文大多是基于 Freebase 的。
Freebase 作为典型的知识图谱,其采用结构化的数据形式(Wikipedia并不是)。Freebase 的内容主要源于 Wikipedia、NNDB、MusicBrainz 以及社会用户的贡献。该项目由 MetaWeb 公司在2005年启动,Google于2010年收购了该公司,并将 Freebase 作为Google知识图谱的核心部分。2016年8月,Google停止了对 Freebase 的维护,并将其整体迁移合并到 WikiData 项目中[1]。目前我知道的有以下几种方法获取到 Freebase 数据。
- Freebase Data Dump:Freebase 官网提供 N-Triple RDF格式(.nt文件)的数据压缩包的下载,整个压缩包30G,解压后300G+。下载后,可以用压缩软件解压,也可以通过编程工具(比如Java的GzipInputStream)边读取边解压。[2][3] (我并没有尝试这个方法)
- FB2M和FB5M:FB2M和FB5M是 Freebase 的两个子集,其中 FB2M 含有2M实体和5k实体关系,FB5M含5M实体和7k实体关系。CSDN上有这个两个文件的下载链接,其中使用 FB5M 还需要下载一个 FB5M 中 entity linke 到 entity name 的映射文件来将语料集的 link 替换掉[4](参考文章[4]中作者也提供了3个文件的下载链接,但可能过期)。下载之后三个文件都是 txt 文件,需要转换为 RDF 格式,文章后面会介绍如何转换为 RDF 格式并配合 Virtuoso 使用,我暂时只处理了 FB2M 数据,所以只说明 FB2M 数据的处理。
- FB15K和FB15K-237:FB15K 也是 Freebase 的子集,而FB15K-237 是 FB15K 的子集。这部分我暂时没有去了解,只提供一个下载链接Download FB15K-237 Knowledge Base Completion Dataset from Official Microsoft Download Center,和链接中对该数据集的一段描述:This dataset contains knowledge base relation triples and textual mentions of Freebase entity pairs, as used in the work published in (Toutanova and Chen CVSM-2015) and (Toutanova et al. Last published: October 30, 2015.
freebase的entity id到真实数据的映射 数据集
...
/m/01jzhl Colin Pine
/m/01jzhl Yaoming
/m/01jzhl 姚明
/m/01jzhl Ming Yao
/m/01jzhl Yow Ming
/m/01jzhl Yáo Míng
/m/01jzhl Yao ming
/m/01jzhl Yao Zhiyuan
/m/01jzhl Yao Meng
/m/01jzhl Yoa ming
/m/01jzj2 Brown hydroboration
/m/01jzj2 Hydroboration-oxidation
/m/01jzj2 Hydroboration–oxidation
/m/01jzj2 Hydroboration
/m/01jzj2 Hydroboration-oxidation reaction
/m/01jzjh Substitution boxes
/m/01jzjh S-Box
/m/01jzjh Sbox
/m/01jzjh Cryptography/s-box
/m/01jzjh S Box
/m/01jzjh SBox
/m/01jzjh S box
/m/01jzjh S-boxes
/m/01jzjh S-table
/m/01jzj_ Korn Ferry International
/m/01jzj_ Korn/Ferry International
/m/01jzkb American Basketball League (1961-1963)
/m/01jzkb American Basketball League 1961-63
/m/01jzkp Neil Arthur
/m/01jzkp Stephen Luscombe
/m/01jzl2 CAST-5
/m/01jzl2 CAST5
/m/01jzlw Taxonomy of the carcharhiniformes
/m/01jzlw Taxonomy of the Carcharhiniformes
/m/01jzlw Shark taxonomy Order Carcharhiniformes
/m/01jzlw List of species of the order Carcharhiniformes
/m/01jzlw Ground sharks
/m/01jzlw Whaler sharks
/m/01jzlw Shark taxonomy Order Carcharhiniformes (cont.)
/m/01jzlw Groundshark
/m/01jzm9 Hók-ciŭ
/m/01jzm9 Fujhou
/m/01jzm9 Fuzhou City
/m/01jzm9 Fuzhou, Fujian
/m/01jzm9 Hokchew
/m/01jzm9 Hockchew
/m/01jzm9 Fuh-Chau
/m/01jzm9 Fuchow
/m/01jzm9 福州
/m/01jzm9 Foochow
/m/01jzm9 Fu Zhou
/m/01jzm9 Fuhchau
/m/01jzm9 Foochow (disambiguation)
/m/01jzm9 Hock Chew
/m/01jzm9 Fúzhou
/m/01jzm9 Foo Chow
/m/01jzm9 福州市
/m/01jzm9 Fu-chou
/m/01jzm9 Fu zhou
/m/01jzm9 Fuzhou, China
/m/01jzm9 Fuzhou Municipality
/m/01jzm9 Fuchou
/m/01jzm9 Fuh Chau
/m/01jzm9 Fu-Chou
...
Freebase及其处理和导入数据库
Freebase Data Dump结构初探
Freebase Data Dump 结构初探(二)——浅析元信息
freebase的entity id到真实数据的映射 数据集
Freebase API (Deprecated)
数据集-知识图谱:FreeBase(通用知识图谱)【英文】相关推荐
- 通用知识图谱VS行业知识图谱
众所周知,知识图谱是Google于2012年提出,用来优化搜索结果.经过多年的发展,知识图谱在人工智能的许多行业都拥有了成熟落地的应用.按照知识图谱的覆盖面来看,主要分为通用知识图谱与行业知识图谱 ...
- 垂直领域知识图谱_垂直知识图谱的构建与应用研究
龙源期刊网 http://www.qikan.com.cn 垂直知识图谱的构建与应用研究 作者:阮彤 王梦婕 王昊奋 胡芳槐 来源:<知识管理论坛> 2016 年第 03 期 摘要: [ ...
- 从零学习知识图谱——01(知识图谱技术介绍)
今年研一,导师给的大范围是知识图谱.从零开始学习知识图谱相关知识,内容大多为笔记和心得,仅供参考.欢迎各位大牛来指导. 知识图谱 (Knowledge Graph,KG) 以结构化的形式描述客观世界中 ...
- 图谱实战 | 京东商品图谱构建与实体对齐
转载公众号 | DataFunTalk 分享嘉宾:赵学敏博士 京东科技 编辑整理:蔡丽萍 TRS 出品平台:DataFunTalk 导读:在电商企业采购和运营过程中,如果要想掌握商品的实时价格等行情 ...
- 吐血整理!12种通用知识图谱项目简介
作者:王楠 赵宏宇 蔡月 来源:大数据DT(ID:hzdashuju) 通用知识图谱大体可以分为百科知识图谱(Encyclopedia Knowledge Graph)和常识知识图谱(Common S ...
- 通用知识图谱的构建及在QQ浏览器的应用实践
今天给大家分享腾讯QQ浏览器知识图谱团队荆宁先生所做的分享<通用知识图谱构建与应用.pdf>,本次分享在整体介绍知识图谱技术的基础上,将重点分享腾讯QQ浏览器团队在图谱构建和应用上的落地实 ...
- 知识图谱系列-2-知识图谱发展历程及其分类
1. 知识图谱发展历程 知识图谱的发展可以从人工智能和语义网(注意语义网和语义网络是不同的)这两个领域进行追溯.在人工智能方面,人类致力于使计算机更智能,能够进行推理.分析.预测等高级思维活动.而知识 ...
- 知识图谱学习笔记之知识图谱中的知识分类
知识图谱中的知识分类 事实知识 事实知识是关于某个特定实体的基本事实,如(山东富士苹果,产地,山东).事实知识是知识图谱中非常常见的知识类型.大部分的事实知识都是在描述实体的特定属性或关系,如&quo ...
- 【知识图谱】 | 《知识图谱——方法、实践与应用》阅读笔记
<知识图谱--方法.实践与应用>的阅读笔记 知识图谱--方法.实践与应用 第1章 知识图谱概述 1.1 什么是知识图谱 1.2 知识图谱的发展历史 1.3 知识图谱的价值 1.4 国内外典 ...
- 知识图谱学习笔记-知识图谱价值和发展历程
一:知识图谱的价值: 1.辅助搜索 传统搜索引擎依靠网页之间的超链接实现网页的搜索,而语义搜索是直接对事物进行搜索,如人物.机构.地点等.这些事物可能来自文本.图片.视频.音频.IoT 设备等各种信息 ...
最新文章
- typora行内公式怎么显示不了,怎么办?
- 23 | MySQL是怎么保证数据不丢的?
- 如何理解signal函数声明
- 倒计时2天!年末最大AI开发者盛典来袭,快来报名
- java设计模式—单例模式
- oracle10g 操作系统,各版本操作系统ORACLE 10g 下载(包括windows和linux)
- C++算法学习(力扣:1269. 停在原地的方案数)
- html和css实现时间表,前端 CSS : 6# 纯 CSS 实现时间线
- 人群密度分析算法调研
- swift学习之数组、字典和字符串
- MacBookPro阻止电脑自动下载更新
- 给你入冬后的第一杯奶茶
- STARK STARK_LT 复现(2021)
- 云计算前景如何?大专学历学习云计算怎么样?
- 大学生为什么要学Linux?Linux有什么优点?
- 【超融合】818超融合发展经历了哪几个阶段!
- hive求某天是当年第几周形如yyyyww
- java多线程之Callable接口
- 14.刚体组件Rigidbody
- H5企业网站模板:蓝绿过渡色功能菜单齐全企业网站模板
热门文章
- 面试阿里数据研发岗,无缘三面,谈谈面经
- 嵌套iframe页面做打印去掉页眉页脚
- 数据中台POC演示流程
- 母婴行业竟也可以免费送?两种案例让你全面了解新的赚钱模式!
- Unity Shader-反射效果(CubeMap,Reflection Probe,Planar Reflection,Screen Space Reflection)
- 在VC6.0下设置Unicode编译环境
- 数据可视化——柱状图
- 编程高手与IT民工的区别在哪?
- 使用httpclient调用url出现错误Illegal character in scheme name at index 0解决方案
- “豫”见超融合,私有云浪潮开启新一线