AI正在向更深层次进化,语言与知识技术的重要性愈加凸显。8月25日,以“掌握知识、理解语言、拥有智能”为主题的百度大脑语言与知识技术峰会重磅开启,百度CTO王海峰发表主旨演讲,解读百度语言与知识技术的发展历程与最新成果,与产学研各界分享技术及产业发展趋势和展望,百度集团副总裁吴甜和百度技术委员会主席吴华分别发布百度语言与知识技术系列产品和数据集共建计划,重磅推出5款产品的新发布,全面加速AI技术大规模应用。在演讲中,王海峰表示,“在百度语言与知识技术的布局和发展中,我们始终在注意把握两个趋势,即技术发展趋势和产业发展趋势,并力争引领趋势。”

语言与知识技术是人工智能认知能力的核心,以语言和知识为研究对象,让机器像人一样掌握知识、理解语言的自然语言处理技术,对于人工智能发展至关重要。十年来,百度大脑语言与知识技术成果丰硕,获得包括国家科技进步奖在内的20多个奖项,30多项国际竞赛冠军,发表学术论文超过300篇,申请专利2000多项。技术不断突破创新的同时,也在产品上创新探索,同时将领先的技术输出给开发者与合作伙伴,提升各行业智能化水平。

百度引领语言与知识技术创新,形成完整技术布局

半个多世纪前,老一辈自然语言处理学者,在一本名为《机器翻译浅说》的书中,畅想了未来跨语言、跨文化的无障碍沟通场景。如今,机器同传、翻译机、跨模态翻译等工具,已融入人们的工作和生活,沟通无国界的梦想正逐步实现。这一切是人工智能技术,特别是语言与知识技术进步所带来的结果。

历经近十年发展,百度已经构建了完整的语言与知识技术布局,包括知识图谱、语言理解与生成技术,以及上述技术所支持的包含智能搜索、机器翻译、对话系统、智能写作、深度问答等在内的的应用系统。

其中,知识图谱是机器认知世界的基础。机器认知能力的突破,越来越依赖对知识和大规模知识图谱的运用。百度打造了世界上最大的多源异构知识图谱,拥有超过50亿实体和5500亿事实,并在不断演进和更新,已应用于各行各业,每日调用次数超过400亿次。

不仅如此,针对不同应用场景和知识形态,百度还建立起多样化的知识图谱类型,既有基础的实体知识图谱,也有行业知识图谱、事件图谱、关注点图谱等,以及融合语音、视频、图片的多模态知识图谱。这背后,是百度创建的包括无标签大数据开放知识挖掘技术、知识体系自扩展的知识图谱自学习技术、以及融合多源异构数据的知识补全与整合技术在内一整套知识图谱构建方法。

在知识的加持下,语言理解相关技术的能力不断增强,机器也可以逐渐像人一样不断学习、不断进步。百度提出知识增强的语义理解框架ERNIE,在深度学习的基础上融入知识,具备人类一样的持续学习能力,曾一举登顶全球权威数据集GLUE榜单,首次突破90分大关,并且超越人类得分。而通过融入知识、语义理解、以及增强小样本学习能力,机器的阅读理解和对话能力也在迅速增强。

当然,和人类认知世界的形式类似,机器认知世界时,也不仅是运用自然语言,而往往是对语音、视觉、语音等多模态信息的综合应用。

为此,百度研制了知识增强的跨模态深度语义理解方法,通过知识关联跨模态信息,运用语言描述不同模态信息的语义,进而让机器实现从“看清”到“看懂”、从“听清”到“听懂”,即图像和语言、语音和语言的一体化理解。而融合场景图知识的跨模态语义理解预训练技术,则大幅提升了跨模态推理能力。

在机器理解自然语言之外,要与人进行交互,语言生成的任务也必不可少。百度基于多流机制的语言生成预训练技术,在语言生成的过程中,兼顾词、短语等不同粒度的语义信息,提升了生成效果。而多文档摘要生成,则通过图结构语义表示,引入篇章结构知识,增强长文本语义表示能力的同时,解决了跨文档领域关系建模难题。结合语言生成技术和其他语言与知识技术,百度打造了智能创作平台,已被20多家媒体所采用,日调用量超过35万次。

领先技术持续落地应用,提升智能化水平

语言与知识技术的全面突破,在搜索、翻译、对话系统等各类产品、应用中得到突出体现。王海峰介绍,通过知识图谱、语言理解和跨模态语义理解等技术,智能搜索帮助用户更加高效、精准、便捷地获取知识和信息。智能搜索再进一步发展,搜索将无处不在。

百度提出了知识图谱驱动的对话控制技术,以及首个基于隐空间的大规模开放域对话模型PLATO等,并推出智能对话定制和服务平台UNIT,可帮助开发者高效构建智能对话系统,实现规模化应用。百度翻译支持200多种语言,每天响应超过千亿字符的翻译请求,支持超过40多万家第三方应用,技术上,提出了多智能体联合学习、基于语义单元的同传模型、稀缺语种分组混合训练算法等。

此外,百度语言与知识技术的成果,也在源源不断通过开源开放平台对外输出,在互联网、金融、医疗、教育等诸多领域发挥作用,提升产业智能化水平的同时,也得到了各方认可,这是近十年来百度语言与知识技术不断进步的最佳证明。

演讲最后,王海峰对语言与知识技术的进一步发展做了展望。他表示,复杂知识表示和快速构建技术,知识与深度学习进一步融合,深度融合感知和认知的跨模态语义理解技术,模型可解释性和鲁棒性等等,仍有很多技术难题需要持续研究和解决。但对于未来,百度充满信心,愿始终坚持探索机器“掌握知识、理解语言、拥有智能”,与学术界、产业界携手,推动语言与知识技术、人工智能技术持续进步,为产业不断升级、社会经济高质量发展做出更大贡献。

十年沉淀、厚积薄发,百度CTO王海峰秀出NLP十年成果相关推荐

  1. 十年沉淀、厚积薄发,百度CTO王海峰详解NLP技术完整布局

    AI正在向更深层次进化,语言与知识技术的重要性愈加凸显.8月25日,以"掌握知识.理解语言.拥有智能"为主题的百度大脑语言与知识技术峰会重磅开启,百度CTO王海峰发表主旨演讲,解读 ...

  2. 第二十二届中国科协年会开幕,百度CTO王海峰等共话产业发展机遇

    8月14日上午,由中国科学技术协会.山东省人民政府主办的第二十二届中国科协年会开幕式在山东青岛举行.年会以"改革开放 创新引领--科技赋能 合作发展"为主题,汇聚了诸多科协领导.院 ...

  3. 第五十六期:百度CTO王海峰CNCC2019演讲:深度学习平台支撑产业智能化

    百度CTO王海峰在会上发表题为<深度学习平台支撑产业智能化>的演讲,分享了百度关于深度学习技术推动人工智能发展及产业化应用的思考,并深度解读百度飞桨深度学习平台的优势,以及与百度智能云结合 ...

  4. 百度CTO王海峰获“光华工程科技奖”,深耕自然语言处理近30年

    11月8日,第十三届光华工程科技奖揭晓仪式在北京举行.该奖项被誉为"中国工程界最高奖项",旨在对我国工程科技及管理领域做出杰出贡献的科学家.工程师进行表彰.百度CTO王海峰因其在人 ...

  5. 百度CTO王海峰服贸会展示AI新基建成果,飞桨获“科技创新服务示范案例”奖

    AI正在为各行各业注入新活力,而AI新基建也在为包括服务贸易领域在内的社会经济发展提供新动力.9月4日,万众瞩目的2020中国国际服务贸易交易会正式召开.这是疫情发生以来,我国在线下举办的第一场重大国 ...

  6. CCKS 2019 | 百度 CTO 王海峰详解知识图谱与语义理解

    本文转载自公众号:机器之心.: 8 月 24 日至 27 日在杭州召开的 2019 年全国知识图谱与语义计算大会(CCKS 2019)上,百度 CTO 王海峰发表了题为<知识图谱与语义理解> ...

  7. 百度CTO王海峰出席科协年会重头论坛,展现智能云产业智能化硕果

    我国经济正在进入高质量发展阶段,科技与经济如何深度融合.高效协同成为重要议题.8月15日,第二十二届中国科协年会开幕第二日,"科创中国"科技创新企业家高峰论坛在青岛国际会议中心举行 ...

  8. 百度CTO王海峰:亚洲丰富实践场景推动AI技术落地探索

    本文已在飞桨公众号发布,查看请戳链接: 百度CTO王海峰:亚洲丰富实践场景推动AI技术落地探索 王海峰 百度首席技术官 亚洲地区国家众多,发展水平差异显著,这背后意味着有丰富的实践场景,可供AI技术落 ...

  9. 百度CTO王海峰荣膺第十三届光华工程科技奖

    11月8日,第十三届光华工程科技奖揭晓仪式在北京举行.该奖项被誉为"中国工程界最高奖项",旨在对我国工程科技及管理领域做出杰出贡献的科学家.工程师进行表彰.百度 CTO 王海峰因其 ...

最新文章

  1. 青岛能源所提出微生物组相似度新算法DMS
  2. Android事件总线还能怎么玩?
  3. 【计算机网络(微课版)】第2章 物理层 课后习题及答案
  4. Symfony 4.3 发布,带来搜索引擎自动保护
  5. 常用类回顾之(String类)
  6. Linux 运维必备150 个命令,值得收藏!
  7. 在计算机硬件中mo是指,计算机导论 - [课件]第2章 计算机系统的硬件.ppt
  8. 怎么形容智能冰激凌机器人_有关于形容描写冰激凌的句子及图片
  9. .c和.h文件的区别(转载)
  10. Linux下安装MongoDB
  11. [渝粤教育] 四川大学 食物营养学 参考 资料
  12. Win7打开文件安全警告怎么关闭
  13. 汽车发动机ECU硬件在环测试系统ETest设计与实现
  14. Arbitrum上首个跨链互操应用开启空投计划!
  15. 重磅!图灵奖,公布!
  16. 前端必会三种CSS布局
  17. CentOS部署ElasticSearch7.6.1集群
  18. Redis分布式锁防止缓存击穿
  19. Microbiome | 西农韦革宏团队揭示植物驯化塑造小麦根际微生物组组装和代谢功能...
  20. Teddy van Jerry 的导航页

热门文章

  1. 如何修改datagrid行的高度_如何开出一份完美的信用证?
  2. EM算法 大白话讲解 没看懂 保存
  3. ViT作者、谷歌大脑研究员翟晓华:大规模视觉表征学习
  4. 两院院士评选2020年中国、世界十大科技进展揭晓,「机器学习模拟上亿原子」等入选 | AI日报...
  5. 新书上市 | 人类程序员,你能不能比三体人更懂量子纠缠?
  6. 开发操作系统的各种方法
  7. 欢迎大家观顾【图灵教育社区】
  8. 《Science》刊登中科院最新突破,用二氧化碳合成淀粉,网友已开始安排诺贝尔奖...
  9. 学术报告 | 数据库专家C.Mohan ——人工智能的前世今生
  10. 独家 | 如何通过TensorFlow 开发者资格考试(附链接)