本文转载自公众号:DI数据智能。


  知识图谱被称为人工智能的基石,它的前身是语义网,由谷歌在2012年率先提出,用于改善自身的搜索业务。Data Intelligence执行主编、东南大学计算机科学与技术学院漆桂林教授这样定义知识图谱:知识图谱是人工智能中研究如何将人类的知识转化为图,从而方便计算机存储并用于推理,计算机可以通过知识图谱实现从感知智能到认知智能的飞跃,支持智能问答、辅助决策、智能分析等应用。DI编委、同济大学特聘研究员王昊奋老师是知识图谱方面的专家,曾深入参与过IBM Watson系统的研发工作,他的定义是知识图谱旨在描述真实世界中存在的各种实体或概念。其中,每个实体或概念用一个全局唯一确定的ID来标识,称为它们的标识符。每个属性-值对用来刻画实体的内在特性,而关系用来连接两个实体,刻画它们之间的关联。

 知识图谱是DI的核心主题之一,创刊以来,已刊发了大量相关论文。我们特别对已出版的知识图谱主题论文进行了整理,并对每篇论文的核心内容做了中文简述,以飨关心和支持DI发展的专家和读者。

 衷心希望DI刊发的文章能启发您的思想,助力您的科研!

 注:点击二维码可直达文章全文页面。

1. Constructing and Cleaning Identity Graphs in the LOD Cloud

Citation: J. Raad, W. Beek, F. van Harmelen, J. Wielemaker, N. Pernelle & F. Saïs. Constructing and cleaning identity graphs in the LOD cloud. Data Intelligence 2(2020), 323–352. https://doi.org/10.1162/dint_a_00057

简述:作者之前的工作展示过一张包含超过5亿条明确含有owl:sameAs语句和350亿条暗含owl:sameAs语句的等价关系图谱(identity graph)。作者提出了一个可扩展的方法,可自动计算每一条语句的错误程度。在本文中,作者生成了整张等价关系图谱的子图,这些子图都包含一定程度的错误数据。本文结论是尽管语义网中包含了许多错误的owl:sameAs语句,语义网上的数据仍是可用的,同时可把因错误使用owl:sameAs语句带来的负面影响降到最低。本文作者之一的Frank van Harmelen教授是荷兰阿姆斯特丹自由大学计算机科学系教授,是世界顶级的语义网技术专家。

2. Virtual Knowledge Graphs: An Overview of Systems and Use Cases

Citation: G. Xiao, L. Ding, B. Cogrel, & D. Calvanese. Virtual knowledge graphs: An overview of systems and use cases. Data Intelligence 1(2019), 201-223. https://doi.org/10.1162/dint_a_00011

简述:虚拟知识图谱技术(VKG)也被称为基于本体的数据访问,本文详细总结了VKG的软件生态圈和应用案例。本文第一作者意大利博尔扎诺自由大学计算机学院Guohui Xiao (肖国辉) 博士,是当今最先进的VKG系统Ontop 研究团队的负责人,作者Diego Calvanese教授是知识图谱领域的国际知名专家。

3. Learning to Complete Knowledge Graphs with Deep Sequential Models

Citation: L. Guo, Q. Zhang, W. Hu, Z. Sun, & Y. Qu. Learning to complete knowledge graphs with deep sequential models. Data Intelligence 1(2019), 224-243. https://doi.org/10.1162/dint_a_00016

简述:本文提出了一种新的知识图谱补全方法,通过扩展多层RNN将知识图谱建模成长度为3的序列,同时提出了3种不同策略来集成RNN单元,并通过实验展示了不同特点。本文通讯作者是南京大学计算机科学与技术系胡伟副教授。

4. KnowID: An Architecture for Efficient Knowledge-Driven Information and Data Access

Citation: P.R. Fillottrani & C.M. Keet. KnowID: An architecture for efficient knowledge-driven information and data access. Data Intelligence 2(2020), 487–512. doi: 10.1162/dint_a_00060

简述:本文介绍了在信息管理系统中知识-数据转换的一种架构,KnowID。该架构提出了在实体-联系模型和关系模型之间转换的新的规则。和其他基于本体的数据访问方法相比,KnowID的突出特点是Runtime 运行可以利用在信息系统设计中经常使用的封闭世界假定思想(closed world assumption),同时利用路径查询提高SQL查询效率。

5. AMiner: Search and Mining of Academic Social Networks

Citation: H. Wan, Y. Zhang, J. Zhang, & J. Tang. AMiner: Search and mining of academic social networks. Data Intelligence 1(2019), 58-76.https://doi.org/10.1162/dint_a_00006

简述:AMiner是一个新型的由作者、论文、会议、期刊以及机构所组成的大规模在线学术搜索与挖掘系统。本文第一作者是北京交通大学万怀宇副教授,通讯作者唐杰教授是国内知名学者、清华大学计算机科学与技术系教授,国家杰出青年科学基金获得者。

6. XLORE2: Large-scale Cross-lingual Knowledge Graph Construction and Application

Citation: H. Jin, C. Li, J. Zhang, L. Hou, J. Li, & P. Zhang. XLORE2: Large-scale cross-lingual knowledge graph construction and application. Data Intelligence 1(2019), 77-98. https://doi.org/10.1162/dint_a_00003

简述:本文介绍了基于维基百科和百度百科自动构建的XLORE升级版的构建和应用。本文为清华大学计算机科学与技术系李涓子教授团队的最新研究成果。李涓子教授目前是中国中文信息学会语言与知识计算专委会主任、清华-青岛数据科学研究院科技大数据研究中心主任。

7. CN-DBpedia2: An Extraction and Verification Framework for Enriching Chinese Encyclopedia Knowledge Base

Citation: B. Xu, J. Liang, C. Xie, B. Liang, L. Chen,& Y. Xiao. CN-DBpedia2: An extraction and verification framework for enriching Chinese encyclopedia knowledge base. Data Intelligence 1(2019), 244-261. https://doi.org/10.1162/dint_a_00017

简述:本文提出了一种抽取加验证的知识库增强框架。相比CN-DBpedia,新版本的知识库(CN-DBpedia2)增加了大量从实体描述文本中抽取出来的高置信度的事实。本文通讯作者肖仰华是复旦大学计算机学院教授、博导、青年973首席科学家。

8. Microsoft Concept Graph: Mining Semantic Concepts for Short Text Understanding

Citation: L. Ji, Y. Wang, B. Shi, D. Zhang, Z. Wang & J. Yan. Microsoft concept graph: Mining semantic concepts for short text understanding. Data Intelligence 1(2019), 262-294. https://doi.org/10.1162/dint_a_00013

简述:本文详述了大型概念知识图谱系统——微软知识图谱 (Microsoft Concept Graph) 的构建实践。通讯作者为微软亚洲研究院纪蕾研究员。

9. Constructing a Scene-Based Knowledge System for E-Commerce Industries: Business Analysis and Challenges

Citation: M. Fu, Q. Chen, W. Lin, P. Wang, & W. Zhang. Constructing a scene-based knowledge system for e-commerce industries: Business analysis andchallenges. Data Intelligence 1(2019), 295-308. https://doi.org/10.1162/dint_a_00012

简述:本文详述了阿里巴巴集团构建的基于场景的知识系统,从商业角度分析该系统的优势和面临的挑战。本文通讯作者为阿里巴巴集团付敏高级工程师。

10. Knowledge Graph Construction and Applications for Web Search and Beyond

Citation: P. Wang, H. Jiang, J. Xu & Q. Zhang. Knowledge graph construction and applications for Web search and beyond. Data Intelligence 1(2019), 345-361. https://doi.org/10.1162/dint_a_00019

简述:本文介绍了搜狗公司构建大规模多源数据知识图谱的案例。作者均来自于搜狗公司。

11. GeoLink Data Set: A Complex Alignment Benchmark from Real-world Ontology

Citation: L. Zhou, M. Cheatham, A. Krisnadhi & P. Hitzler.  GeoLink data set: A complex alignment benchmark from real-world ontology. Data Intelligence 2(2020), 353-378. https://doi.org/10.1162/dint_a_00054

简述:本文构建了用于本体匹配的来自于GeoLink 项目的真实数据集。本文第一作者来自于堪萨斯大学计算机系Pascal Hitzler教授团队。Pascal Hitzler教授是语义网领域国际知名学者,Semantic Web 期刊的创刊主编(Founding Editor-in-Chief) 。

12. The Computer Science Ontology: A Comprehensive Automatically-Generated Taxonomy of Research Areas

Citation: A. A. Salatino, T. Thanapalasingam, A. Mannocci, A. Birukou, F.Osborne & E. Motta. The computer science ontology: A comprehensive automatically-generated taxonomy of research areas. Data Intelligence 2(2020), 379-416. https://doi.org/dint_a_00055

简述:本文详述了计算机科学本体(Computer Science Ontology)的自动构建过程。该本体包括1.4万个主题,12.2万条语义关系。本文通讯作者Angelo A. Salatino是英国开放大学知识媒体研究所的教授,FrancescoOsborne是语义网领域的国际知名青年学者。

13. Refining Linked Data with Games with a Purpose

Citation: I. Celino, G. Re Calegari & A. Fiano. Refining linked data with games with a purpose. Data Intelligence 2(2020),  417-442. https://doi.org/dint_a_00056

简述:本文构建了嵌入众包任务以优化关联数据的开源软件游戏框架。本文通讯作者Irene Celino为意大利Cefriel公司知识技术团队负责人,是语义网技术和人机对话技术领域国际知名学者。

14. The Semantic Data Dictionary – An Approach for Describing and Annotating Data

Citation: S.M. Rashid, J.P. McCusker, P. Pinheiro, M.P. Bax, H. Santos, J.A. Stingone, A.K. Das & D.L. McGuinness. The semantic data dictionary –an approach for describing and annotating data. Data Intelligence 2(2020), 443–486. https://doi.org/dint_a_00058

简述:利用语义数据字典可促进数据的被发现、互操作、可重用,可溯源和可再现。本文展示了可公开获取的美国国家健康与营养检验调查数据集的语义标注的实例,讨论了数据建模的挑战,描述了研究者利用语义数据字典方法进行的工作,包括美国国立卫生研究院资助的大型健康数据网站和伦斯勒理工学院和IBM合作的“分析、学习和语义”健康赋能项目。在评测部分,研究者们设计了四个指标:数据、语义、FAIR原则和普适性,分别对比了语义数据字典、传统数据字典、映射语言和数据集成工具在这四个指标上的得分。研究者们也对该方法的局限性进行了讨论并对未来研究方向进行了展望。

15. An RDF Data Set Quality Assessment Mechanism for Decentralized Systems

Citation: L. Huang,Z. Liu, F. Xu & J.Gu. An RDF data set quality assessment mechanism for decentralized systems. Data Intelligence 2(2020), 487–511. https://doi.org/10.1162/dint_a_00059

简述:本文提出了RDF数据质量评测模型,利用区块链技术记录数据质量评测结果,设计了针对质量评估结果的升级策略。

16. KB4Rec: A Data Set for Linking Knowledge Bases with Recommender Systems

Citation: W.X.Zhao, G. He, K. Yang, H. Dou, J. Huang,S. Ouyang, & J.-R.Wen. KB4Rec: Adata set for linking knowledge bases with recommender systems. Data Intelligence 1(2019), 121-136. https://doi.org/10.1162/dint_a_00008

简述:本文展示了数据集KB4Rec v1.0。该数据集将三个广泛使用的推荐系统数据集的物品链接到两个流行的知识图谱—FreeBase和YAGO。本文通讯作者为中国人民大学信息学院赵鑫副教授。


OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

论文浅尝 | Data Intelligence 已出版的知识图谱主题论文相关推荐

  1. 论文浅尝 | Data Intelligence - 多篇语义资源论文

    本文转载自公众号:DI数据智能 . 编者按:Data Intelligence最新发表一组语义资源论文,包括世界著名语义网技术专家荷兰阿姆斯特丹自由大学计算机科学系Frank van Harmelen ...

  2. 论文浅尝 | Data Intelligence第4期正式上线啦

    本文转载自公众号:数据智能英文刊 各位关注DI期刊的专家学者和业界同仁:Data Intelligence第4期正式上线啦!本期共出版2篇研究性论文,5篇数据论文,1篇实践类论文.点击每篇文章标题下方 ...

  3. 论文浅尝 | 基于深度序列模型的知识图谱补全

    本文转载自公众号:DI数据智能. Learning to Complete Knowledge Graphs with Deep Sequential Models 作者:郭凌冰.张清恒.胡伟.孙泽群 ...

  4. 论文浅尝 - ACL2020 | IntKB: 一种交互式知识图谱补全框架

    笔记整理 | 谭亦鸣,东南大学博士 来源:  ACL 2020 链接:https://www.aclweb.org/anthology/2020.coling-main.490.pdf 资源:http ...

  5. 论文浅尝 | AAAI2020 - 基于生成对抗的知识图谱零样本关系学习

    论文笔记整理:耿玉霞,浙江大学直博生.研究方向:知识图谱,零样本学习等. 来源:AAAI2020 论文链接:https://arxiv.org/pdf/2001.02332.pdf 本文是发表在AAA ...

  6. 论文浅尝 | 用于低资源条件下知识图谱补全的关系对抗网络

    论文作者: 邓淑敏,浙江大学在读博士,研究方向为低资源条件下知识图谱自动化构建关键技术研究. Ningyu Zhang, Shumin Deng, Zhanlin Sun, Jiaoyan Chen, ...

  7. 论文浅尝 | 可建模语义分层的知识图谱补全方法

    本文转载自公众号:PaperWeekly. 论文作者:蔡健宇,中国科学技术大学,研究方向:知识图谱 近些年,知识图谱(Knowledge Graph)在自然语言处理.问答系统.推荐系统等诸多领域取得了 ...

  8. 论文浅尝-综述 | 基于强化学习的知识图谱综述

    转载公众号 | 人工智能前沿讲习 论文来源:https://crad.ict.ac.cn/CN/10.7544/issn1000-1239.20211264 摘要:知识图谱是一种用图结构建模事物及事物 ...

  9. 论文浅尝 - CIKM2020 | 用于推荐系统的多模态知识图谱

    论文笔记整理:王琰,东南大学硕士. 来源:CIKM 2020 链接:https://doi.org/10.1145/3340531.3411947 研究背景与任务描述 为了解决推荐系统中的数据稀疏和冷 ...

最新文章

  1. Python中将两个列表数据zip起来并遍历(Iterating through two lists in parallel)
  2. 8086键盘输入实验——《x86汇编语言:从实模式到保护模式》读书笔记07
  3. 喜马拉雅xm格式转化mp3_怎样让mp3录音转文字?
  4. 原创《SQL基础知识第2版》PDF高清版,限时下载!
  5. springcloud feign 服务调用其他服务_微服务实战——SpringCloud与Feign集成
  6. 保险条款精解(二) 丢车——如何将损失降到最低点?
  7. UNIX/Linux系统取证之信息采集案例
  8. android开发歌词滑动效果_一些Flutter开发中的“坑”
  9. FindBugs插件的安装与使用
  10. oracle服务器cpu 100,Oracle数据库服务器CPU一直100%怎么处理-sql优化方面
  11. C语言中的strcmp函数的作用是什么,c语言strcmp函数用法是什么?
  12. 【Social listening实操】从社交媒体传播和文本挖掘角度解读《欢乐颂2》
  13. php论坛首页一般是什么,bbs是什么
  14. Python学习DAY5|数据分析简介与实战
  15. xampp php搭建失败,ThinkPHP框架搭建及常见问题(XAMPP安装失败、Apache/MySQL启动失败),thinkphpxampp...
  16. Android AOSP 下载和编译
  17. intval()和(int)转换使用与区别
  18. 利用开源软件30分钟搭建自己的voip网络电话系统V1.1
  19. shell-环境变量以及环境变量的配置文件
  20. 徐州计算机软考培训,徐州2017办公软件一对一培训

热门文章

  1. eval()解析JSON
  2. 内存淘汰机制 LRU cache
  3. 同事说rar压缩有风险,让我用zip压缩文件
  4. 如何快速构建嵌入式全栈知识体系?
  5. vim 设置支持鼠标
  6. php session警告屏蔽,PHP Session的一个警告
  7. 每日一题(34)—— 线程
  8. Linux C目标文件
  9. 机器学习面试——XGBoost,GBDT,RF(上)
  10. 招银网络笔试java_最新!!招银网络科技Java面经,整理附答案