关于知识图谱上下级概念建设的一点想法
对知识图谱有所了解的人,都知道知识图谱是对知识的整理,以点和边的形式呈现,属于人工智能中的“符号主义”流派。虽然知识图谱可以清晰地告诉我们各个知识点之间的关联和区别,但我们还是无从知晓图谱中哪些节点相似性高,因此建立知识图谱并不是终极目标,还有许多后续工作需要开展。其中,对知识图谱进行同义关系建设和上下级关系建设也是比较重要的工作。
同义关系,即同义词,也就是对知识图谱中的节点建立同义关系,这些同义关系的节点实际上就是同一个事物。本文将会介绍笔者对知识图谱上下级概念建设的一点想法。
什么是上下级概念建设
在日常生活中,我们提到“苹果”,往往会认为它是一种水果,而水果属于植物;提到《霸王别姬》,往往会认为它是一部电影,而电影又属于文艺作品。其实,这就是一种上下级关系,从知识图谱角度来说,苹果
和《霸王别姬》
都是知识,它们分别属于某个概念:水果
和电影
,而这些概念又分别从属于更高级、更抽象的概念:植物
和文艺作品
,这就是上下级概念
。
值得注意的是,知识图谱的上下级概念建设并不是对知识点打标签,而是对知识点做梳理、归纳、总结,它应该是细粒度的层级建设。可以想见,一个设计良好、层级丰富、层次分明的上下级概念体系,能够帮助我们更好地理解知识图谱中的知识点。
为什么要做上下级概念建设
那么,为什么要做上下级概念建设呢?个人觉得主要是两方面的原因,一方面是对知识点做归纳整理,另一方面是对知识点有更好的理解。
知识图谱的概念从语义网络
发展而来,自然也有与语义网络相似的地方。在语义网络中,我们的基本单元是词汇
(word),而词汇之间会存在同位词
(或者同义词)和上下位词
。这样的体系已经有相关的例子,比如英文的WordNet以及中文的哈工大大词林。类似地,知识图谱的知识点也需要对知识点进行归纳、整理、总结,将它们都纳入到一个统一的同义关系和上下级层级体系中,做到设计良好、层级丰富、层次分明,这是对知识图谱的更细颗粒度的概念建设,能帮助我们对图谱有更好的理解。
此外,做好上下级概念建设,也可以帮助我们更好地理解图谱中的知识点。一方面,是对知识点本身更好的理解。参考上图中的东方明珠,如果我们按上述的上下级概念层级去理解该节点,则东方明珠既是电视塔(建筑物),又是公司(机构),那么东方明珠应该同时具备电视塔和公司这两种概念的基本特性。
另一方面,它也可以帮助我们更好地理解文本中的实体,对NLP任务有更好的提升。比如以下文本:
今年7月,市场研究公司Canalys Research发布了第二季度全球智能手机市场占有率排名,小米手机销量超越了苹果,首次晋升全球第二位;三星排名依然是第一位;OPPO和vivo分别为第四位、第五位,市场占比都是10%。而小米的全球智能手机市场占有率达到17%,同比增长83%。
文本中共出现了多个实体:小米、苹果、三星、OPPO、vivo,其中苹果既可能是手机品牌,也可能是水果,但借助下面的上下级概念图谱,我们就不难理解该文本中的苹果
应当指的是手机
,而不是水果
。
上下级概念建设的价值
做好上下级概念建设,对搜索、推荐、知识补充等也有很大价值。
在搜索场景
中,如果用户搜索“杭州植物园”,那么可以通过知识图谱中的上下级概念层级知道其上级概念为“动植物园”,可理解用户是在搜索动植物园。这可以帮助系统更好地理解用户意图,与打标签有类似的作用,可进一步帮助改进搜索效果,提升用户搜索体验。
在推荐场景
中,可通过知识图谱中的上级概念推荐相似实体,比如用户在搜索了“复旦大学”、“上海交通大学”、“上海理工大学”,借助这三个实体的上级概念“大学”及定位信息为上海,可以推荐上海的大学,比如同济大学等同一层级实体。这可以帮助系统更好地去推荐产品或服务,同时对推荐结果有一定的可解释性。
在知识补充场景
中,可借助上下级概念及同层级其它知识点,发现某些节点所缺失的属性或关系,通过外部数据或其他手段进行补充。
总结
本文是对笔者在实际工作(知识图谱的上下级概念建设)的一点思考,现在网络上关于这块的文章比较少,大多都是零星的想法,希望能对上下级概念建设方面的资料有所补充,能抛砖引玉吸引更多人对此的讨论~
现阶段关于知识图谱上下级概念建设的文章和研究工作不是很多,但也有不少学者、机构、公司对此作出了辛勤劳动和创新想法,文章最后将这些参考文献列在下方,希望后续这方面的文章和研究工作会越来越多~
参考文献
- 哈工大大词林:http://101.200.120.155/
- 常识性概念图谱建设以及在美团场景中的应用:https://tech.meituan.com/2021/06/24/nature-language-process-nlp-knowledge-graph.html
- 通用概念知识图谱介绍:https://www.cnblogs.com/haodingkui/p/11353807.html
- 中文通用概念知识图谱(CN-Probase):http://www.openkg.cn/dataset/95c9040c-f3e1-417a-860a-c419cb80d1a7
关于知识图谱上下级概念建设的一点想法相关推荐
- 知识图谱基本概念工程落地常见问题
作者:cavities 来源:https://zhuanlan.zhihu.com/p/62824358 编辑:happyGirl 简要说明一下,搞了知识图谱架构一年半,快两年的一些小心得,后续不定期 ...
- 一文总结知识图谱基本概念和工程落地常见问题
" 本文介绍了入门知识图谱需掌握的若干基本概念并对知识图谱工程落地面临的常见问题给出了解答" 作者:cavities 来源:https://zhuanlan.zhihu.com/p ...
- 技术动态 | 去中心化知识图谱协作平台建设实践
转载公众号 | DataFunTalk 文章作者:Epik 铭识协议 出品平台:DataFunTalk 导读:1月10日,由EpiK铭识协议主办的"2021开源知识运动"主题活动 ...
- 知识图谱的概念、应用与构建
目录 1.什么是知识图谱? 2.什么是信息提取? 3.自然语言理解 3.1 信息抽取的主要任务 1.什么是知识图谱? 互联网时代,搜索引擎是人们在线获取信息和知识的重要工具.当用户输入一个查询词,搜索 ...
- 知识图谱·概念与技术--第1章学习笔记--知识图谱概述--知识图谱的概念,与传统语义网络的区别
知识图谱·概念与技术--第1章学习笔记--知识图谱概述--知识图谱的概念,与传统语义网络的区别 知识图谱的概念,与传统语义网络的区别 狭义概念 作为语义网络的内涵 与传统语义网络的区别 优点 缺点 与 ...
- 本体、语义网络和知识图谱的概念与区别
随着科技的不断发展,数据的不断累积,催生了新时期的知识工程.本体.语义网络和知识图谱都是近期不同的知识工程的载体,作为知识管理模型已经被广泛应用在人工智能及知识工程领域,在知识共享.知识推理和智能辅助 ...
- 知识图谱发展的三个时期以及事理图谱概念辨析
一.知识图谱发展三个周期 知识图谱,从2012年谷歌正式将这一概念应用到工业界之后,到现在已经逐步走过了将近7年的时间,在这七年的时间里,知识图谱逐步经历了从概念兴起.概念泛化.技术挣扎与落地尴尬三个 ...
- 中科大脑知识图谱平台建设及业务实践
本文首发于 Nebula Graph Community 公众号 "为了支持城市复杂场景下各类需求,中科大脑知识图谱团队设计开发了一套包含本体可视化设计.数据映射.数据抽取.数据写入.图数据 ...
- 老焦专栏 | 一个典型的知识图谱应用建设案例
转载本文需注明出处:微信公众号EAWorld,违者必究. 1 知识图谱的几种典型应用方式 基于知识图谱的应用可以分为几种典型的类型,这几种应用使用的场景各有不同,在使用技术上也各有侧重,我们希望能够根 ...
最新文章
- VMware上实现LVS负载均衡(NAT)
- table表格细边框
- 程序员面试金典 - 面试题 05.07. 配对交换(位运算)
- 进程与multiprocessing模块
- 【springboot】application.yml配置文件中数据库密码password加密后显示
- Codeforces 439C Devu and Partitioning of the Array(模拟)
- Java大对象lob_JavaEE JDBC 读写LOB大对象
- #define中的三个特殊符号:#,##,#@
- 不可能解开的谜题 (程序员修炼之道,评注者序)
- 关于异常你还不知道的
- 服务器挂机自动签到京东,解放双手,什么值得买自动签到京东自动签到给你更多时间享受生活...
- Java聊天室yadiChat step1 登陆注册
- 编码规范 SonarQube检测出的bug、漏洞以及异味的修复整理
- beta阶段测试基本概况报告
- html策略类文字游戏,中国唯一 一款运营超20年的网游竟然是款纯文字游戏
- 快速搭建日志系统——ELK STACK
- Tandem Repeats Finder:串联重复序列查找工具
- Arduino使用u8g2库函数驱动4线/6线OLED屏幕(I2C/SPI通讯)附带库函数详解
- Java的OOP(面向对象编程)总结,有这一篇足矣
- matlab求拉斯反变换,MATLAB拉式反变换输出结果有问题