作者:Will Douglas Heaven

翻译:王可汗

校对:和中华

本文约1200字,建议阅读8分钟

最新的研究结果表示,自然语言处理尽管在GLUE上取得好成绩,但仍然无法达到真正理解自然语言。

许多看起来能理解语言并且在一组常见的理解任务中比人类得分更高的人工智能模型,都没有注意到句子中的单词被混淆了,这表明它们根本就不懂语言。问题源于这些自然语言处理(NLP)系统的训练方式,不过这也指出了一种改进方法。

阿拉巴马州奥本大学(Auburn University)和奥多比研究中心(Adobe Research)的研究人员在试图让一个自然语言处理系统对其行为产生解释时发现了这个漏洞,比如为什么它声称不同的句子意味着同一件事。当测试他们的方法时,他们意识到在一个句子中打乱单词对解释没有影响。作为这项工作的领导者,奥本大学的Anh Nguyen说,“这是所有NLP模型的普遍问题。”

该团队研究了几个基于BERT(谷歌开发的语言模型,支撑了包括GPT-3在内的许多最新系统)的最先进的自然语言处理系统。所有这些系统在GLUE(通用语言理解评估)上的得分都高于人类。GLUE是一套用来测试语言理解能力的标准任务,比如发现释义,判断句子是否表达了积极或消极的情绪,以及文字推理。

人咬狗:他们发现,当句子中的单词打乱时,这些系统无法辨别,甚至当新顺序改变了意思时。例如,系统正确地识别出“大麻会导致癌症吗?”和“吸食大麻如何导致您患上肺癌?”属于释义。但他们更确定“你吸烟致癌,大麻如何能给肺?”和“吸大麻能给肺怎么你癌症?”意思也是一样的。系统对那些意义相反的句子——比如“大麻会致癌吗?”和“癌症会导致吸食大麻吗?判定为同样的意思。

唯一一个与词序有关的任务是让模型检查一个句子的语法结构。其他任务下,测试系统75%到90%的答案在单词被打乱时没有变化。

这是怎么了呢?这些模型似乎是从一个句子中挑出几个关键词,而不管它们的顺序是什么。他们不像我们人类一样能理解语言,并且,GLUE——一个非常流行的基准——也不能衡量真正的语言使用。在许多情况下,用于训练模型的任务并不强迫它关心词序或语法。换句话说,GLUE教会了NLP模型跳读。

许多研究人员已经开始使用一套更硬核的测试,称为超级GLUE,但Nguyen怀疑它会有类似的问题。

Yoshua Bengio和他的同事也发现了这个问题,他们发现,在对话中对单词进行重新排序有时并不会改变聊天机器人的反应。Facebook的一个人工智能研究团队在中文上也发现了这种情况。Nguyen的团队表明,这个问题很普遍。

这个问题严重吗?这取决于应用程序。一方面,如果人工智能能像人类一样,在你打错字或说错话时仍然能理解,那将是很有用的。但总的来说,在分析句子的意思时,词序是至关重要的。

如何解决呢?好消息是,解决这个问题可能不是太难。研究人员发现,通过训练模型去做一个词序重要的任务(比如发现语法错误),迫使模型专注于词序,也能让模型在其他任务中表现得更好。这表明,调整训练模型的任务将使它们整体表现得更好。

Nguyen的研究结果再次表明模型往往远达不到人们所认为的能力。他认为,这凸显了让人工智能像人类一样理解和推理是多么困难。Nguyen说,“没人知道怎么做。”

原文标题:

Jumbled-up sentences show that AIs still don’t really understand language

原文链接:

https://www.technologyreview.com/2021/01/12/1016031/jumbled-up-sentences-ai-doesnt-understand-language-nlp-bert-fix/

编辑:黄继彦

校对:林亦霖

译者简介

王可汗,清华大学机械工程系直博生在读。曾经有着物理专业的知识背景,研究生期间对数据科学产生浓厚兴趣,对机器学习AI充满好奇。期待着在科研道路上,人工智能与机械工程、计算物理碰撞出别样的火花。希望结交朋友分享更多数据科学的故事,用数据科学的思维看待世界。

翻译组招募信息

工作内容:需要一颗细致的心,将选取好的外文文章翻译成流畅的中文。如果你是数据科学/统计学/计算机类的留学生,或在海外从事相关工作,或对自己外语水平有信心的朋友欢迎加入翻译小组。

你能得到:定期的翻译培训提高志愿者的翻译水平,提高对于数据科学前沿的认知,海外的朋友可以和国内技术应用发展保持联系,THU数据派产学研的背景为志愿者带来好的发展机遇。

其他福利:来自于名企的数据科学工作者,北大清华以及海外等名校学生他们都将成为你在翻译小组的伙伴。

点击文末“阅读原文”加入数据派团队~

转载须知

如需转载,请在开篇显著位置注明作者和出处(转自:数据派ID:DatapiTHU),并在文章结尾放置数据派醒目二维码。有原创标识文章,请发送【文章名称-待授权公众号名称及ID】至联系邮箱,申请白名单授权并按要求编辑。

发布后请将链接反馈至联系邮箱(见下方)。未经许可的转载以及改编者,我们将依法追究其法律责任。

点击“阅读原文”拥抱组织

独家 | 混乱的句子表明AI仍然不能真正理解语言相关推荐

  1. 谷歌机器智能大牛:AI模型要真正理解人类语言,关键是「序列学习」

    来源:新智元 编辑:David 如果计算机给了你所有正确的答案,是否意味着它和你一样了解世界? 这是人工智能科学家几十年来一直争论不休的谜题.随着深度神经网络在与语言相关的任务中取得了令人瞩目的进步, ...

  2. AI 的下一个重大挑战:理解语言的细微差别

    简评:人类语言非常博大精妙,同一句话在不同的语境下,就有不同的含义.连人类有时候都不能辨别其中细微的差别,机器能吗?这就是人工智能的下一个巨大挑战:理解语言的细微差别.本文原作者是 Salesforc ...

  3. Meta AI发布具有200种语言的高品质机器翻译人工智能模型

    Meta AI所打造的NLLB-200是第一个能对200种不同语言提供先进质量翻译的单一人工智能(AI)模型. Meta AI也建立了全新的评价数据集FLORES-200,并衡量NLLB-200在每种 ...

  4. .NET Core使用微软AI认知服务识别文字语言

    点击上方蓝字关注"汪宇杰博客" 识别一段文字的语言有多种途径,在这个以AI为热点的时代,我们也可以给自己的应用强行加上AI,然后就能加上"智慧"的名字" ...

  5. CVPR 2020 | 京东AI研究院对视觉与语言的思考:从自洽、交互到共生

    纵观视觉与语言在这六年间的飞速发展史,它就仿佛是两种不同文化(计算机视觉与自然语言处理)的碰撞与交融.这里每一种文化最初的进化都是自洽的,即独立地演化形成一套完备的视觉理解或语言建模体系:演化至今,我 ...

  6. 为什么说python适合ai_为什么Python被认为是AI和机器学习的最好语言?

    原标题: 为什么Python被认为是AI和机器学习的最好语言? 男怕嫁错郎,女怕入错行.对于我们这一代人来说,有幸生于人工智能的新时代,会一门手艺这个时代非常重要,对于程序员来说,想要从事AI和机器学 ...

  7. 独家 | 这可能会引领通用AI的下一个重大突破

    作者:Karen Hao 翻译:张一然 校对:欧阳锦 本文约2500字,建议阅读8分钟. 研究者们正在教一个大型的语言模型如何去"看"以帮助他们更好的理解这个世界. 标签:自然语言 ...

  8. 独家 | Face++印奇:AI是场持久战,但第一阶段明年结束

    若朴 发自 凹非寺 量子位 出品 | 公众号 QbitAI 印奇今年29岁. 六年前,他创办了人工智能公司旷视科技(Face++).这家公司提供的产品和服务,很像美剧<疑犯追踪>中的场景. ...

  9. 独家专访英特尔AI布道师 | 通信工程到人工智能的高质量转型

    上海大学.贝尔实验室(中国).埃森哲.英特尔 通信领域到人工智能 本期特别嘉宾 人生经历处处高光 2022年9月22日19:00-20:00 [比特熊故事汇2.0] 熟悉的时间 "加速进阶& ...

最新文章

  1. 开发日记-20190601 关键词 读书笔记《鸟哥的Linux私房菜-基础学习篇》
  2. PyTorch基础(part4)
  3. 【THUSC2018】史莱姆之友【长链剖分】【链分治NTT】
  4. p2p linux 开源项目,权威开源项目(linux系统、sip、live555)
  5. linux 为什么要安装gcc和gcc-c++(又叫做g++)
  6. 数据结构和算法9——哈希表
  7. 企业IT治理样板间首次直播,教您如何打造高效可控的云环境
  8. 未能成功加载扩展程序_JVM类加载 - 大碗炸酱面
  9. Read-a-Card 读取 RFID 卡
  10. PRCV2021 第四届中国模式识别与计算机视觉大会开放注册
  11. Lionel Messi
  12. 【大学物理】第一章:质点运动学
  13. 齐齐哈尔大学计算机专业好么,齐齐哈尔大学(专业学位)计算机技术考研难吗
  14. 【CentOS-7.4】Sphinx 安装与简单配置
  15. 【信息安全-科软课程】Lab2环境变量和Set-UID程序实验
  16. 数据库-jdbc、spring-jdbc、spring-boot-starter-jdbc
  17. 从事GIS开发多年,2017年对GIS行业的心得,尤其对三维GIS的理解 1
  18. 数字字符串位数不足左边补零
  19. 数独求解算法(回溯法和唯一解法)java实现
  20. Flutter(十六)——Hero动画

热门文章

  1. 编写程序,输入某年某月,求该月有多少天
  2. hive的数据定义之创建数据库和表
  3. 让我们来谈谈对Linux的认识,值得每一位运维人员深读
  4. [SimpleOJ229]隧道
  5. 多线程EXecutor 柜架示例
  6. 通过反射获取及调用方法(Method)
  7. TableLayout(表格布局)
  8. .net课堂流水账_20110118
  9. IP地址审计在事件追溯中的应用
  10. labview虚拟心电监测系统_机器视觉系统单相机模型