允中 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

语言与智能技术发展到了什么程度?未来的技术发展趋势是什么?如何与其他人工智能技术协同发展?都是值得思考与探讨的问题。

作为“最具挑战”的认知智能,自然语言处理(NLP)是人工智能发展过程中亟待突破并实现落地的重要问题。在过去几年里,基于深度学习的自然语言处理取得了巨大成功,但其局限性也逐渐显现。

为了共同探讨这个问题,中国计算机学会与中国中文信息学会联合创办了“语言与智能高峰论坛”,邀请工业界与学术界一起加入进来。

今年,语言与智能高峰论坛今年已经举办到第四届。本届论坛于8月24日在北京语言大学礼堂召开,邀请到了国内外相关领域的学术界和工业界资深专家学者。

论坛开始,由大会主席、中科院院士张钹院士致辞。

张钹院士指出:

过去的3年,可以说是深度学习和自然语言处理“深度”结合的3年,自然语言处理的研究方法、模型框架均发生巨大变化,研究和应用上都取得了一系列突破。

尽管深度学习在自然语言处理和人工智能领域取得了巨大的成功,它的局限性也逐渐显现。作为典型的数据驱动方法,深度学习所面临的可解释性不强,鲁棒性差等难题同样在自然语言处理中存在。

为了应对面临的挑战,我们提出发展第三代人工智能的理念,一是与数学与神经科学等结合发现新原理和构建新模型,二是把数据驱动与知识驱动方法相结合,这也是自然语言处理未来发展的必由道路。

上午,大会特邀多名NLP的资深学者和业界翘楚,就自然语言处理技术的热点、难点以及前沿方向进行了深度的剖析。

新加坡国立大学教授李海洲在题为《Adequacy-fluency Evaluation of Natural Language》的报告中指出要让机器像人一样对文本进行评估。

报告以机器翻译为例,提出要仿照人类评价的方式,“信达雅”,同时使用原文和参考译文,结合Adequacy与Fluency这两个角度评价机器译文。Adequacy代表了“信”与“达”,Fluency则是“雅”。这为机器翻译,对话系统等评价指标有争议的领域,提供了一种新的思路。

北京理工大学计算机学院院长黄河燕发表题为《语言智能处理及应用展望》的报告,从科技发展的一般规律引入,阐述了语言智能处理的研究概况及现状,并分析了目前研究的几个难点与不足。

随后,黄河燕对观众介绍了知识图谱,机器阅读理解,自动问答等自然语言处理主要领域的发展。最后,报告就语言智能处理的未来作了展望,认为多模态协同,垂直化以及多学科的交叉融合可能会成为未来热门的趋势。

华为诺亚方舟实验室语音语义首席科学家刘群博士演讲的题目为《基于深度学习的自然语言处理:边界在哪里?》的报告分为三个部分。

首先介绍了通过深度学习解决的自然语言处理中的问题,从语言形态和句法结构等角度阐述了神经机器翻译之于基于规则的机器翻译与统计机器翻译的优势。

接下来,报告以还没有解决的问题为主题,探讨了资源稀缺,可解释性等当下的难题。

更近一步地,刘群博士指出,人工智能之所以在围棋、电子竞技等项目上大获成功,一个主要原因是这些问题都是定义明确的。而大部分的自然语言模型,还只是流于对词语符号之间的关系建模,没有对所描述的问题语义进行建模。

人在理解自然语言时,大脑中有一个客观世界模型,而目前大部分自然语言处理系统没有这个客观世界的模型。知识图谱是建立通用性模型的一种长期努力,但仍然不能得到大规模成功的应用。

微软研究院医学自然语言处理主任潘海峰博士题为《Machine Reading for Precision Medicine》的报告,从精准医疗的角度,向大家阐述自然语言处理在MTB文献处理以及CaaS信息抽取上的应用。

潘海峰博士将整个任务的工作量类比为金字塔,顶端的部分需要大量的专业知识,人工智能很难完成。底部寻找候选的部分是大海捞针的一步,医疗专家们在此耗费的时间是最多的,而这恰恰是自然语言处理可以做的一步。专家和机器各取所长,可以大幅地提高效率,造福人类医疗事业。

京东人工智能研究院常务副院长何晓东博士题为《从语言理解到多模态智能》的报告,首先回顾了近年来深度学习,语音和自然语言处理的一些进展。

之后,报告指出,人类从多个知识源学习,包括文本,语音,视觉,知识,从而有一个更深刻的了解。因而我们在发展新一代人工智能技术的时候,必然也要综合多个模态进行联合学习与推理,才能达到通用人工智能。这些从不同模态提取的语义表征,将被映射到一个统一的语义空间,在这个空间进行智能的理解,推理,变换,决策。

何晓东博士还通过情感会话智能,绘画机器人,多模态问答等例子,向观众介绍了多模态的广泛应用。

另外,本届论坛还设立了“青年科学家与企业论坛”,邀请了北京大学万小军教授、清华大学长聘副教刘知远、微软亚洲研究院主管研究员段楠、狗尾草智能科技有限公司人工智能研究院院长邵浩先生以及北京妙笔智能科技有限公司CEO周登平先生进行主题报告。

为了推动语言理解与智能技术的发展,从2018年开始,高峰论坛联合百度公司举办了语言与智能技术的评测。2019设立了机器阅读理解、知识驱动的对话和信息抽取三个任务,吸引了来自国内外的2,376支队伍报名,超过80%的211高校参加了本次评测。

此外,本届高峰论坛的一个特色环节是学术界与工业界的圆桌对话,学术界和工业界的资深专家就语言与智能领域的技术创新和商业应用前景进行智慧碰撞。

本次对话,由北京大学赵东岩研究员主持,参与对话的有来自学术界的李海洲、周明、马少平、孙乐、刘知远,和来自工业界的百度技术委员会主席吴华、狗尾草智能科技有限公司的邵浩、北京妙笔智能科技有限公司的周登平。

嘉宾们首先讨论了人工智能发展的现状与重大成果。随后,对于“学术界与企业界如何合作”的问题,嘉宾们表达了“学界提供算法,公司提供算力”,“公司力取,学界智取,专注于小规模的数据”,“学校的好处,就是可以试错,把原本不靠谱的事情做得靠谱了,就可以交给公司了”等观点,引发了在场观众对于学术界和工业界的深深思考。

而对于“人工智能的定义”,嘉宾们则各抒己见。有的嘉宾支持“能替代人类工作的就是人工智能”,也有的嘉宾认为机器真正地模拟了人类高级能力与智慧才算“人工智能”。

直播 | 揭秘最强中文NLP预训练模型

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

一起探讨NLP的边界和未来,学术界与工业界在“语言与智能高峰论坛”上擦出火花...相关推荐

  1. 借鉴人类,跨越模态 | NLP和预训练模型未来的发展之路

    [专栏:研究思路]近来,超大规模预训练模型快速发展,在自然语言处理领域引起热议.基于深度学习的自然语言 处理技术正沿着"极大数据.极大模型.极大算力"的轨道,"无所不用其 ...

  2. 【报名】杨植麟 :从学习的角度看NLP的现状与未来

    活动议程 日期:11月26日(周四) 时间 主题 19:00-19:05 主持人介绍 张家俊,中国科学院自动化研究所研究员,智源青年科学家 19:05-20:20 <从学习的角度看NLP的现状与 ...

  3. 活动推荐 | 首届“中新人工智能高峰论坛”,与周志华、李德毅等大咖对话未来...

    近年来,随着国家社会经济的持续发展,各种新技术.新模式也在不断进步和创新,而人工智能无疑是眼下最热的领域.从宏观上来看,AI已经连续两年被写入政府工作报告:从细分的产业界来看,各类基于计算机视觉.语音 ...

  4. 首届“中新人工智能高峰论坛”即将召开,周志华、李德毅......与你一起对话未来!...

    南京的人工智能的新时代已经来了! 近年来,随着国家社会经济的持续发展,各种新技术.新模式也在不断进步和创新,而人工智能无疑是眼下最热的领域.从宏观上来看,AI已经连续两年被写入政府工作报告:从细分的产 ...

  5. BERTopic:NLP主题模型的未来!

    文| ZenMoore 编| 小轶 以前我一直以为,主题建模(提取文档的主题词)这种机器学习时代就开始研究的基础工具,现在肯定已经到头了,虽然...有时效果可能不是那么让人满意. 但突然看到一则推文: ...

  6. 百家争鸣|国内外NLP领域学术界和工业界的牛人和团队

    https://mp.weixin.qq.com/s/t7ZM1Es72-_AsSX7KxqGMw 作者:沧笙踏歌 zenRRan有改动 根据这几年的积累,整理了一份国内外学术界和工业界的牛人和大牛团 ...

  7. 国内外NLP领域学术界和工业界的牛人和团队

    转载自https://mp.weixin.qq.com/s/MD2-xMWWXx7rpfWzd5XDxA 非常不错的总结 根据这几年的积累,整理了一份国内外学术界和工业界的牛人和大牛团队,供大家申请硕 ...

  8. 与WebXR共同创建者Diego Marcos一起探讨沉浸式Web的未来(上)

    点击上方"LiveVideoStack"关注我们 翻译 | Alex 技术审校 | 刘连响 本文来自UploadVR,作者为David Heaney WebXR 影音探索 #005 ...

  9. 探讨云实践 共享云未来 云基地专场开幕

    本文讲的是探讨云实践 共享云未来 云基地专场开幕[IT168 资讯]5月23日-5月25日,2012第四届中国云计算大会云基地专场拉开帷幕,展示云实践.探讨云趋势,共享云未来.云基地专场全面展示了云计 ...

最新文章

  1. 在linux上装git教程,教你玩转Git-Linux 平台上安装
  2. 需求: 计算一下你来到这个世界多少天 拓展:改成 生日是键盘录入的 而且可以循环录入 直到录入 exit 结束循环
  3. html如何让字体自动变色,CSS使文字部分变色
  4. 学了阿里中台,却依然做不好系统? 聊聊阿里的项目管理
  5. gini系数 决策树_SKlearn中分类决策树的重要参数详解
  6. ubuntu 12.04陷入software center的searching/cancelling...
  7. CIO:节省IT部门开支十招
  8. bootdo跳sign in页面
  9. 程序员数学(15)--分式
  10. 赵福全对话余凯:深度解析汽车芯片创新
  11. 【转】使用 HTML5 设计辅助功能
  12. 个推数说中国42年冬奥史,可视化演绎冰雪奇缘
  13. Java加密技术(一)—— HMACSHA1 加密算法
  14. python 读excel中的sheet_python实现读取excel文件中所有sheet操作示例
  15. unity中移动部件靠近时触发动画,模型替换特效演示
  16. python画图颜色填充_Python使用Turtle图形函数画图 颜色填充!(学习笔记)
  17. DXGI快速截屏录屏技术
  18. CNI系列(三)插件实现
  19. 股票自动委托下单html,股票怎么设置自动挂单?股票挂单的方式(2)
  20. VisualSVN Server使用手册

热门文章

  1. IDC:企业向云转变推动了SD-WAN市场增长
  2. VS清除打开项目时的TFS版本控制提示
  3. 【Boost】timer、progress_timer和progress_display
  4. Mysql Explain 详解
  5. php中int()强制转换,php下intval()和int强制转换使用的区别是什么
  6. 序列两两比对算法_【陪你学生信】八、序列两两比对
  7. iar升级芯片库_顶10个GPU!阿里巴巴重磅发布含光800芯片
  8. 路由跟踪工具0trace
  9. c语言结构体共用体枚举实例程序,10-C语言结构体-共用体-枚举
  10. python 最小硬币数_程序以找到要在Python中达到目标的硬币组合数量