「大模型」之所短,「知识图谱」之所长
近两年,人工智能领域的大模型可谓炙手可热。以自然语言处理领域为例,自BERT横空出世,在各种评测上分数一飞冲天,在斯坦福阅读理解评测集上超越人类水平之后,各种越来越大的自然语言处理模型不断涌现,并在各种评测中不断刷新出新的记录。
图1是近年来不同的预处理模型的情况,可以看出模型规模呈指数级增长。由此,许多人已经对模型越大效果越好(Larger model, better performance)深信不疑,并逐渐形成了AI领域的“军备竞赛”。
图1 “大模型”的参数指数级增长
确实!如果仅仅考虑各种评测,以刷榜为目标的话,这种趋势毫无争议。不管是微软与 OpenAI的Megatron-Turing NLG,还是谷歌的 PaLM,以及国内如智源研究院的悟道、百度文心3.0等,其评测成绩之斐然是有目共睹的。但这一切并不是没有批评的声音。
一方面,这种超大模型的能力是存在争议的,其到底是具备“超级能力”,还是因为其训练语料足够丰富而使得模型仅仅是“记忆”这些内容?进一步地,这种基于深度学习的大模型,还有其天然的难以解释的特点。
另一方面,这种依靠超级计算资源和数据资源打造的大模型,在面对真正的应用时显得心有余而力不足,绝大多数情况下,仅仅适用于“刷个榜”,即使财大气粗,也无法真正使用这些看起来非常美好的“大模型”。
此外,在许多领域的专业应用中,比如尖端医疗器械制造的失效分析,因其语料在广泛的数据中显得数据量如此之少,而在使用这些大模型时毫无优势。
于是,有识之士在这种“超级算力”+“海量数据”+“大模型”的范式之外,提出了以“算法”+“算力”+“数据”+“知识”的新范式。
比如,张钹院士就说过“人的智能没法通过单纯的大数据学习把它学出来,那怎么办?很简单,加上知识,让它有推理的能力,做决策的能力。”
而知识图谱则是人工智能领域中用以存储和表示知识的最新的一种方法,目前正驱动这人工智能的进一步发展,也被认为是实现认知智能的核心技术之一。
事实上,对于芸芸众生,这些大模型“可望而不可及”。
最近几年我一直在达观数据做自然语言处理和知识图谱的技术研究、产品开发和产业落地方面的工作。期间走访了各行各业的头部企业,了解到不管是金融行业的巨头,制造业各细分领域的领头羊还是垄断性大国企,都没有将这些大模型使用在其业务上,用于提升效率、降低成本、提升竞争力等。甚至于人工智能巨头也没有很好地用上这些大模型。
而以知识图谱为核心的认知智能技术,因加入了“知识”这一人类发展经验的总结,使得能够摆脱“大模型”的缺陷,更适合于在各行各业的实践应用。
并且,以知识图谱为核心的认知智能技术,因其计算资源更少,推断结果可解释,进而在产品落地和产业应用中具备了极大的优势。
为了介绍这种具备巨大前景又具有非常实在的产业应用的认知智能技术,我倾注了大量的心血,梳理知识图谱的前沿技术研究成果,总结十多年来在人工智能产品开发和产业应用方面的经验,写下了学术界和企业界十多位知名专家倾力推荐的《知识图谱:认知智能理论与实战》一书。
内容简介
本书系统全面地介绍了知识图谱的核心技术,既有宏观整体的技术体系,也有关键技术和算法细节,内容包括:
知识图谱模式设计的方法论——六韬法;
知识图谱构建中的实体抽取和关系抽取;
知识存储中的属性图模型及图数据库,重点介绍了JanusGraph分布式图数据库;
知识计算中的图论基础,以及中心性、社区检测等经典图计算算法;
知识推理中的逻辑推理、几何变换推理和深度学习推理,及其编程实例。
最后,本书以金融、医疗和智能制造三大行业的应用场景为例,梳理了知识图谱的应用价值和应用程序形态。
图2 《知识图谱:认知智能理论与实战》内容框架
本书特色
适读人群
本书既适合人工智能行业从业者和研究人员系统学习知识图谱,也适合一线工程师和技术人员参考使用,并可作为企业管理人员、政府人员、政策制定人员、公共政策学者的参考材料,以及高等院校计算机、金融和人工智能等相关专业师生的参考资料和培训学校的教材。
知识图谱作为人工智能中知识获取、存储和使用的技术,是弥补深度学习和“大模型”短处的良方,是缝合认知智能前沿技术理论和产业应用的有效方法。“日月丽乎天,百谷草木丽乎土”,知识乃是人工智能不断进步必不可少的养分,因而知识图谱也正是人工智能进步的阶梯。
希望《知识图谱:认知智能理论与实战》这本书能够为读者在探索这个人工智能中提供一点帮助,能够为认知智能的产业应用做出微薄的贡献。
扫码了解本书详情
「大模型」之所短,「知识图谱」之所长相关推荐
- 叮!请查收本周份「知识图谱」专题论文解读
本期内容选编自微信公众号「开放知识图谱」. TKDE ■ 链接 | https://www.paperweekly.site/papers/2194 ■ 解读 | 花云程,东南大学博士,研究方向为自然 ...
- 专题解读 |「知识图谱」领域近期值得读的 6 篇顶会论文
本期内容选编自微信公众号「开放知识图谱」. CIKM 2017 ■ 论文 | Hike: A Hybrid Human-Machine Method for Entity Alignmentin La ...
- 以史为鉴 | 为什么要将「知识图谱」追溯到1956年?
本文转载自公众号:AI科技评论. 作者 | Claudio Gutierrez 编译 | MrBear 编辑 | Tokai 以史为鉴,可以知兴替.纵观近期包括 AAAI.NeurIPS.IJCAI ...
- 遥遥无期还是近在咫尺?长文展望「大模型」商业化前景
[栏目:工程系统]从2018年谷歌提出BERT预训练语言模型至今,作为深度学习领域的集大成者,超大规模预训练模型(简称:"大模型")仅仅走过了三年的发展历程. 大模型技术 ...
- 论文浅尝 | 「知识图谱」领域近期值得读的 6 篇顶会论文
本文转载自公众号:PaperWeekly. CIKM 2017 ■ 论文 | Hike: A Hybrid Human-Machine Method for Entity Alignmentin La ...
- 「知识图谱」领域近期值得读的 6 篇顶会论文
CIKM 2017 论文 | Hike: A Hybrid Human-Machine Method for Entity Alignmentin Large-Scale Knowledge Base ...
- 「医疗知识图谱」到「综合性医疗大脑」
本文首发于个人博客:www.bobinsun.cn 背景 最近,由于某些原因,特别关注了医疗知识图谱方面的发展&应用情况,有了些浅薄认识,故码此文,以供参考. 随着智能时代的到来,把临床数据. ...
- 云栖大会上,阿里巴巴重磅发布前端知识图谱!
大家好,我是若川,点此加我微信进源码群,一起学习源码.同时可以进群免费看Vue专场直播,有尤雨溪分享「Vue3 生态现状以及展望」 阿里巴巴前端知识图谱,由大阿里众多前端技术专家团历经1年时间精心整理 ...
- 4场直播,哈工大、亚马逊等大咖为你带来机器学习与知识图谱的内容盛宴
机器学习和知识图谱是当今技术领域的热门话题,随着相关技术的不断发展,无论是对两类技术单独的探讨,还是将机器学习和知识图谱相结合的尝试,都在吸引越来越多的关注. 5月16日下午,来自亚马逊.墨奇科技.S ...
最新文章
- 关于less在DW中高亮显示问题
- Java+Selenium3.3.1环境搭建
- java正则表达式:查找所有{XXX}
- 时空AI技术:深度强化学习在智能城市领域应用介绍
- docker多个容器一起打包_如何链接多个Docker容器并封装结果?
- iOS 13发布日期确定 苹果WWDC2019定档!
- c语言自动变量与静态变量,C语言的中的静态变量和局部变量(自动变量)
- winform flash
- java inflater_Android下LayoutInflater的正确使用姿势
- 零基础如何学习C语言
- FFmpeg png格式图片转yuv420
- 华为FreeBuds 5耳机声音变小怎么办?
- amesim子模型_AMESim进行实际物理建模及建模的一般过程
- Http之referer详解
- 自定义变量的一个有趣案例
- 华为交换机、路由器设备怎样配置console登录密码
- 通俗易懂聊springMVC中的handler是什么
- Pinia:Vue3.js的状态管理器
- 企业宣传片如何快速接入微信公众号中?
- Java中向上转型与向下转型
热门文章
- 前端技术栈之html,css,js
- ASM AAM能用来做什么
- .ajax表单校验插件,表单验证插件——validate
- CImage修改图片大小
- 微信小程序TOP100揭晓,多数为低频APP
- 在使用npm install 的时候提示 core-js-pure postinstall 执行出错
- # 2017年蓝桥杯省赛cc++本科B组试题
- 多隆:从工程师到阿里巴巴合伙人
- 【Grasshopper基础2】Grasshopper电池的输入和输出不是那么详的解/进一步了解Params
- 基于Java+SpringBoot+Vue在线培训考试系统设计与实现