下一个十年:数据信仰与认知智能

http://blog.sina.com.cn/s/blog_cfa68e330102z9ej.html

下一个十年,哪些技术将带来革命性的改变?

在一个新技术层出不穷的时代,对于这个问题,恐怕大部分企业与组织都在积极思考。

百分点技术副总裁兼首席架构师刘译璟博士认为,在产业数字化逐步深入的趋势下,以自然语言处理(NLP)、知识图谱为代表的认知智能技术将会以场景为切入点,通过以点带面、从局部到整体、层层推进的方式实现突破,从而为数字世界的交互与决策带来颠覆性改变。

为什么认知智能技术得到业界如此重视呢?这一切还得从数据开始说起……

//数据信仰正在加速形成//

尤瓦尔赫拉利曾在《未来简史》中预言:数据将成为人们未来的信仰。

现实情况中,企业与组织对于数据及其价值的认可度也在迅速提升。业界普遍认为,数据正在成为一种新型的生产资料,是未来企业/组织业务运转中不可或缺的要素。一位制造业企业CIO在向笔者谈到数据驱动业务时表示:“随着研发、制造、仓储、物流、服务等业务环节的数据全方位打通,为大数据、物联网、人工智能等技术的应用奠定了重要基础,智能制造已经不再是空想,未来将是数据进驱动业务。”

事实上,类似这样的企业不占少数。产业数字化和企业数字化转型的大浪潮下,基于数据的能力正在加速显现,并且得到越来越多用户的认可。就如IDG《2018中国企业数字化发展报告》中提到,企业在数字化转型过程中将逐步形成变革能力、敏捷能力、利用生态的能力、数字化产品与服务、数据资产化能力、经验数据化能力,这一切的基础就是数据。

刘译璟博士直言,用数据的角度去看待业务和现实,在观念上是一个巨大的转变,随着数字化程度越来越高,一个与物理世界相对于的数字世界在加速形成,并且物理世界与数字世界之间的交互会愈发频繁。因此,感知智能、认知智能等人工智能技术将会有巨大的用武之地,用户对于数据的信仰也将会加速形成。

//从感知到认知:靠深度学习不够//

众所周知,得益于算力大幅提升、数据愈发丰富以及以深度学习为代表的算法突破,以图像识别、语音识别为代表的感知智能技术近年来取得了突飞猛进的进步,并且在金融、零售、教育、安防、智慧城市等多行业与领域得到了应用。

不过,这还远远不够。

从技术发展的角度来看,从感知智能向认知智能是必然趋势,因为无论是图像中事物关系,还是语言中语义,都需要进行识别、理解,这恰恰正是认知智能技术正在努力解决的事情;从现实的角度来看,认知智能技术可以从海量数据中不断挖掘、提炼和汇聚知识,人们渴望有更深层次的认知,从而更好地了解客观世界。

在刘译璟看来,感知智能技术很快会在实际业务中遇到瓶颈,比如在语音识别中,如果只做文字层面的转换,而不能从认知层面去理解文本/文字的含义,那么对于用户的价值其实并不高;未来一定需要从认知层面去理解视觉中动作的含义、文字中语义与含义,从而了解业务变化并为决策提供支撑。“从数据到信息,再到知识,认知智能技术将发挥至关重要的作用。”

对于深度学习,刘译璟博士认为,深度学习技术的确是推动了感知智能技术的快速发展,但是仅仅依靠深度学习技术是远远不够的,深度学习是纯粹基于数据的方法,属于归纳的范畴,并不具有可解释性,在一定阶段后具有明显的瓶颈,从感知智能走向认知智能,仅仅依靠深度学习是远远不够的,还需要有更多突破。

//认知智能:到底应该如何突破?//

某种程度而言,认知智能技术的发展并没有像感知智能那样快速,依然有着众多挑战等待突破。

虽然近年来很多大公司在努力推动包括云计算、大数据、人工智能技术的发展,构建出系列技术平台,希望屏蔽掉底层技术的复杂性,推动包括认知智能技术在内的应用发展,但在实际业务场景中应用并未取得令人满意。

刘译璟直言,人工智能的变革需要场景应用来驱动。正所谓是,独立存在不是技术追求的目标,依托场景应用才是技术存在的真实意义。刘译璟认为,以知识图谱、自然语言处理为代表认知智能技术的确还有很多需要突破的地方,长期在行业场景实践中实现突破是最佳的方式。

对于任何一项新技术都不能在一开始就抱有不切实际的幻想。“不能过分夸大人工智能技术现阶段的能力,以自动驾驶位列,L5级别的自动驾驶现阶段的确是非常难实现,因为它要求机器在任何时候都比人做的好。但是我们可以先从一些特定场景中实现突破,继而逐步实现更多场景的应用。像自动驾驶在目前城市出租车、园区接驳车这些场景中就已经得到实现和突破。”刘译璟补充道。

“未来3-5年,认知智能一定会取得更多突破。”刘译璟表示,人工智能进入到中期之后,将会更多的下沉到各个行业之中,将会更多更加具体的业务场景,意味着专业化程度会更高,可用的数据也将更少,专家和方法的重要性会大幅提高。“像知识工程、语义分析这些认知智能层面的技术将再次兴起。”

在众多认知智能技术中,自然语言处理被认为是人工智能皇冠上的明珠,而知识图谱则被认为人工智能的基石,那么对于这两项重要的认知智能技术,未来又会有哪些具体挑战?

//如何让自然语言处理绽放光芒?//

物理世界与数字世界之间的交互与交流,自然语言处理技术是必不可少。

笔者认为自然语言处理一定会在未来得到更多发展和应用。某种程度而言,自然语言处理正在重新定义人与机器,物理世界与数字世界之间的交互方式,过去依靠屏幕、键盘的交互方式,会越来越多被语音、动作所取代,这时就需要自然语言处理来理解、判断和推理。

事实上,自然语言处理技术已经在不同行业的多项业务中得到了初步的使用,比如智能客服、智能翻译、智能机器人等。但是,从目前来看,大部分的应用的效果其实没有符合大众的期望值。业界也普遍认为,自然语言处理依然存在着很大的挑战。

百分点首席算法科学家苏海波博士认为,自然语言处理技术的突破的确是目前业界的巨大挑战。在他看来,挑战主要包括:带标识数据严重不足、文本迁移、文本推理、多模态融合的文本理解等等。“现阶段,没有通用的自然语言处理技术。自然语言处理四个层面主要为:形式、语义、推理和语用,现阶段自然语言处理在从语义到推理的阶段发展。”

苏海波博士介绍:“在语料足够丰富的场景下,比如智能问答、智能客服等,深度学习借助足够的场景标注语料,自然语言处理是可以达到不错的效果。但是百分点在大量实际客户场景中发现,用户面临最实际的问题就是如何在标注样本比较少的情况下,也能运用好深度学习技术,实现更佳的效果。”

根据苏海波介绍,业界目前的趋势是融合,希望利用融合来实现自然语言处理技术的突破,比如Google提出的BERT预训练语言模型,先去预先训练和学习很多知识,然后融入到语言模型中,再结合用户的具体场景,达到预想效果。“这种方式虽然标注样本较少,但是同样可以达到非常好的效果。”

苏海波博士介绍,百分点目前也积极在一些客户的场景中采用这种思路去提升NLP效果,并且取得了非常不错的效果。“预训练语言模型类似迁移学习的思想,把之前的学习迁移到不同的场景中,这将在本质上突破NLP。”

“自然语言处理的突破指日可待,未来它的黄金时代即将到来。”苏海波博士表示。

//知识图谱:认知智能的基石//

如果说人工智能面临两大难题,一是人机交互,那另外一个就是行业知识、专家资源的匮乏。

这也是知识图谱的价值所在。所谓知识图谱,就是通过知识的关联性形成一个网状的知识结构,形成知识图谱的过程本质是在建立认知,理解世界、应用或业务。机器通过知识图谱可以更智能地从客观世界中获得知识,从而更加智能。

尤其是人工智能技术越往行业中下沉,越会面临着专业数据、知识匮乏的难题,缺乏相关训练的数据来源。刘译璟博士直言,传统机器学习都是归纳的方法。如果在一个新的领域,缺乏足够的数据将会面临冷启动的问题,这时候就必须需要人的经验和知识,将对业务的理解和认知告诉机器,这种对话就是知识图谱,当机器形成一定规模之后,就可以实现知识的共享。

“没有人工,就没有智能。”目前,通用性知识图谱已经逐渐构建成熟,而行业知识图谱则刚刚兴起。如何构建一套适合这个行业比较有使用价值的知识图谱,则必须借助业务专家。刘译璟表示:“在一个具体行业中,不可能像通用知识图谱那样去实现,必须借助业务专家,有了本体之后去对接数据和应用。”

去年,百分点提出了动态知识图谱的概念。刘译璟强调,动态知识图谱核心价值在于动态,即人对于业务的理解不是一层不变的,这种理解随时随刻都可能发生改变,动态知识图谱就是可以快速反应出人的这种认知变化。

//下一个十年:从这场发布会开始!//

作为国内企业级大数据+人工智能技术与应用服务商,百分点一直走在人工智能应用的最前沿,多年以来专注于大数据操作系统、智能认知产品以及智能决策应用场景的落地,并致力于大数据、人工智能技术在行业中的落地与应用,在大数据、认知智能技术积累了丰富的实践经验。

11月29日,百分点将发布基于大数据+认知智能技术的最新产品、成立认知智能实验室。此次新品的发布,这将会是百分点在大数据+人工智能领域的又一次沉淀。

对于认知智能,一直走在实践最前沿的百分点会给我们带来什么惊喜,敬请期待!

下一个十年:数据信仰与认知智能相关推荐

  1. 认知智能,AI的下一个十年 | AI Procon 2020

    整理 | 屠敏 出品 | AI科技大本营(ID:rgznai100) 60 年间的「三起两落」 ,人工智能的沉浮变迁. 在 1956 年的夏天,人工智能在美国达特茅斯大学召开的学术会议之上蹒跚学步,吸 ...

  2. 清华唐杰教授:人工智能的下一个十年,认知推理是重点(附PPT下载)

    来源:学术头条 本文约4400字,建议阅读5分钟 本文为大家带来<人工智能下一个十年>的主题报告. 标签:人工智能 2020 年 3 月 25 日,智源研究院学术副院长.清华大学计算机系唐 ...

  3. 认知智能,AI 的下一个十年 | AI Procon 2020

    整理 | 屠敏 出品 | AI科技大本营(ID:rgznai100) 60 年间的「三起两落」 ,人工智能的沉浮变迁. 在 1956 年的夏天,人工智能在美国达特茅斯大学召开的学术会议之上蹒跚学步,吸 ...

  4. 北京智源大会 | AI + 医疗的下一个十年:从公共卫生预警到人类基因密码解析 道翰天琼认知智能api机器人接口。

    医疗事关人身安全,要求极高,容错率极低,因此,知识壁垒和技术壁垒都很高.过去,AI系统更多的是服务于终端,辅助医生诊断.决策.但是,医疗很复杂,直接切入终端问题很多.未来十年,AI+医疗会碰撞出怎样的 ...

  5. 北京智源大会 | AI + 医疗的下一个十年:从公共卫生预警到人类基因密码破解 道翰天琼认知智能api机器人接口。

    医疗事关人身安全,要求极高,容错率极低,因此,知识壁垒和技术壁垒都很高.过去,AI系统更多的是服务于终端,辅助医生诊断.决策.但是,医疗很复杂,直接切入终端问题很多.未来十年,AI+医疗会碰撞出怎样的 ...

  6. 北京智源大会 | AI + 医疗的下一个十年:从公共卫生预警到人类基因密码破解 道翰天琼认知智能api机器人接口1。

    医疗事关人身安全,要求极高,容错率极低,因此,知识壁垒和技术壁垒都很高.过去,AI系统更多的是服务于终端,辅助医生诊断.决策.但是,医疗很复杂,直接切入终端问题很多.未来十年,AI+医疗会碰撞出怎样的 ...

  7. 英方软件:Data+引领数据复制的下一个十年

    点击上方关注我们! 接到英方软件新产品发布会的邀请才突然意识到,从2011正式成立到2020年,在我印象中那个始终意气风发.敢拼敢闯的英方软件,如今已经十岁了,并且在国内数据复制基础软件领域拥有了响当 ...

  8. Hinton等6位图灵奖得主、百余位顶级学者邀你加入群聊,共话人工智能下一个十年...

    Geoffrey Hinton等6位图灵奖得主亲临,百余位顶级学者邀请你加入群聊「2020北京智源大会」,深入系统探讨「人工智能的下一个十年」. 自2009年深度学习崛起以来,第三波人工智能浪潮席卷全 ...

  9. 6位图灵奖获得者、10多位院士在线“教学”,这套关于“人工智能下一个十年”的课程免费提供给你...

    2020 年 6 月 21-24 日,第二届北京智源大会将以线上直播形式盛大召开,本届大会邀请了包括 6 位图灵奖获得者.10 多位院士在内的上百位人工智能领域的顶级专家学者,围绕技术.应用.基础设施 ...

最新文章

  1. vs连接mysql建一个表并增删查改_VS连接SQL Server数据库,增删改查详细教程(C#代码)...
  2. 谷歌工程师:聊一聊深度学习的weight initialization
  3. html combobox select控件设置默认选项
  4. Linux 命令(70)—— size 命令
  5. Dstream的action算子与RDD的action算子
  6. 回归问题中代价函数选择的概率解释(Probabilistic interpretation)
  7. 【设计】全差分设计报告
  8. Flash cs4 for mac 序列号
  9. 磁盘的组成、MBR、GPT
  10. 相机PHP,C/C++、C#、PHP相机开发实例 大恒相机SDK
  11. 如何进行Web服务的性能测试
  12. Kooboo CMS - 之后台注册用户流程方法。
  13. Java Beans 是什么?
  14. 集合转换成数组的两种方法---toArray()和toArray(T[] a)
  15. java-php-python-ssm企业人事管理系统计算机毕业设计
  16. qq群 发言统计for tc
  17. fiddler如何看
  18. 下列不属于计算机未来发展趋势的是,1-9 关于计算机的发展趋势,下面哪种不是未来发展趋势 ____________ 。_学小易找答案...
  19. keras 受限玻尔兹曼机_目前深度学习的模型有哪几种,适用于哪些问题?
  20. codeforces 558c558d558e

热门文章

  1. 2022 年第十二届 MathorCup 高校数学建模挑战赛思路
  2. 遇到问题---eclipse--java--tomcat运行web项目报错Licensed to the Apache Software Foundation (ASF) under one or m
  3. BTE1650 FBL1N/FBL2N/FBL3N/FBL5N-增加客制化字段 客商及科目描述
  4. 小儿秋季腹泻,巧用口服补液盐防脱水
  5. 小程序新爆点,小程序能分享朋友圈了
  6. cannot import name ‘mean_squared_erro‘ from ‘sklearn.metrics‘
  7. 计算机发展的各个阶段是以什么作为标志的,计算机发展的各个阶段是以什么作为标志的?...
  8. java 取上界_Java中的上界通配符 - java
  9. openrov,bluerov(树莓派代码)水下机器人树莓派、BBB板--组装自己的rov(准备篇)
  10. Pg extention pgcrypto