参与科学测试的800个人工智能都难以及格,AI还需努力。

从2011年,Watson在问答节目Jeopardy上击败了最优秀的人类选手,到2016年谷歌的人工智能系统打败了欧洲围棋冠军,人们似乎对人工智能能够超越人类智慧的可能性就更加坚定了。2012年,IBM的人工智能系统Watson成功被克利夫兰诊所勒纳大学医学院录取,开始了它的医学研究生涯。医学生们希望Watson经过训练能够在对医学的理解能力上更进一步。但是,经过三年的训练,最终的结果似乎并不尽如人意。

Watson并没有通过美国八年级(相当于初二)的科学测试,严格来说并不符合医学院的录取条件,当初被允许进入医学部恐怕也有不少的水分存在。

华盛顿大学的计算机科学教授Oren Etzioni和艾伦人工智能研究所近期举办了一场比赛,邀请到800个人工智能团队,并将其AI系统进行八年级的科学测试。最终结果显示,表现最好的也就及格水平而已,可见大部分的人工智能系统的能力还不如八年级的学生。

这次长达五个月的测试足以可见人工智能的发展现状,深度神经网络的推出促进了人工智能的发展,再加上Google、Facebook、微软等在图像语音识别领域的迅速发展,已经使得人工智能达到了比较高的人类表现水平。但是想机器达到人类的思考水平,就目前的技术而言并不是一件现实的事,甚至连基本的对话功能与科学测试都不能满足,想要更进一步的发展还需不懈的努力。

科学测试是比问答节目、围棋比赛都难的一个项目,不仅包含知识的问答,还要求能够理解基本的概念。比如其中的一个多项选择问题:一些鱼类成熟后的多数时间都生活在盐水中,但会在淡水中产蛋。它们适应不同环境的能力是什么的最佳例证?机器人就无法解决,就算是使用神经网络也无法答出来。对此,Etzioni表示,自然语言的处理、推理、以及理解相关的概念都是非常复杂的问题,需要更多的推理运算才能够解决。

虽说参赛的大多数人工智能系统都是学术机构或是独立的研究员研发出来的,但是就算是巨头科技企业生产出来的产品应该也不会强太多。谷歌的表现可能会好一点,但是大众的集体智慧也同样不容小觑。

此次IBM拒绝参赛,对外的解释是由于对这样的比赛没有什么兴趣,现在关注的重点是现实世界问题的解决。此外,Watson也早已经不是最为合适的测试对象,以前是针对问答比赛,现在已经发展成为一系列人工智能工具的集合产品了,并不能充分代表大众的水平。

此次Etzioni的测试主要是对于语言处理的能力,可以了解机器对于人类语言的理解程度。现在IBM的服务也已经包含了自然语言的处理问题。而从Watson问世以来,该技术已经受到了深度神经网络的影响,就像是可以使用大量的猫咪图片教会神经网络识别猫一样,也可以使用对话来进行自然语言的理解训练。比如谷歌正在开发一种聊天机器人,可以和你探讨人生意义。

虽说这种聊天机器人的技术并没有什么信服力,但是现在的人工智能早已经不单单是一种技术,在未找到通用方法之前,就需要更多的机器学习和人工智能工具。但是尽管在此次的Etzioni测试中,参赛者已经使用了很多的工具,结果并不是非常地理想。

也有人表示让机器去进行科学测试并不具备太大的意义,应该关注更加深远的领域,多项选择、自然语言的理解、科学测试等等都不是人类应该追求的目标,真正要做的应该是智能程序可以自然掌握内容。当然,凭现在的技术,想要实现这个目标还需要更加的努力。

原文发布时间:2016-02-18 16:43
本文作者:宇瞄
本文来自云栖社区合作伙伴镁客网,了解相关信息可以关注镁客网。

还在担心机器人?人工智能目前水平还不如初中生相关推荐

  1. 测试行业3年经验,从大厂裸辞后,面试阿里、字节全都一面挂,被面试官说我的水平还不如应届生

    测试员可以先在大厂镀金,以后去中小厂毫无压力,基本不会被卡,事实果真如此吗?但是在我身上却是给了我很大一巴掌... 所谓大厂镀金只是不卡简历而已,如果面试答得稀烂,人家根本不会要你.况且要不是大厂出来 ...

  2. 面试阿里、字节全都一面挂,被面试官说我的水平还不如应届生

    测试员可以先在大厂镀金,以后去中小厂毫无压力,基本不会被卡,事实果真如此吗?但是在我身上却是给了我很大一巴掌... 所谓大厂镀金只是不卡简历而已,如果面试答得稀烂,人家根本不会要你.况且要不是大厂出来 ...

  3. Nature突破:首个比头发丝还细的机器人诞生了!可用针头注射入人体

    来源:科研大匠 1959年,诺贝尔奖得主.理论物理学家Richard Feynman 首次提出微型医用机器人的概念.此后,将电子器件微型化以生产细胞大小的机器人一直是科学家们追求的目标,但由于缺乏合适 ...

  4. “鸡娃”新选择?首个AI象棋机器人来了,还当起了郭晶晶家的私教!

    整理 | 于轩 出品 | 程序人生(ID:coder_life) 正值暑假,有孩子的家长却犯了愁.是放任孩子在家沉迷电子产品?还是为孩子报各种补习班,从此奔波在接送孩子的路上? 近日,人工智能软件公司 ...

  5. 为什么AI的翻译水平还远不能和人类相比?

    作者 | SHARON ZHOU 译者 | 王天宇 编辑 | 2812 出品 | AI 科技大本营 [导读]前一段时间,大家都在热议 Google 的翻译系统出现了一些相当奇怪的结果,例如下图呈现的是 ...

  6. 30岁还能转行学人工智能吗?

    人工智能正在不断的发展过程中,在不断吸纳人才的过程中,不乏有一部分30岁以上的人员也加入到人工智能的行列中.那30岁还能转行学人工智能吗?目前人工智能技术仍然处于技术的发展初级阶段,对于所有入行者来说 ...

  7. 机器人总动员拟人后_还记得《机器人总动员》中的Wall-E嘛?

    原标题:还记得<机器人总动员>中的Wall-E嘛? 看图说话,这款小小的萌萌的机器人叫做Cozmo,虽然有点像个挖掘机-- 但是它可是以影响一代人的.<机器人总动员>中的Wal ...

  8. 游戏行业校招大揭秘,还在担心学了找不到工作吗?

    今天给大家普及一下游戏公司校招那些事,将会从三个维度(何为校招.校招优势.校招准备)带领大家认识各大知名游戏公司的校招活动.让同学们对校招有一个初步全面的了解!话不多说我们开讲了! 对于在校大学生来讲 ...

  9. 你还在担心开车看不到路标吗?我这这有个路标分类的来玩玩啊(有源码有数据集)

    你还在担心开车看不到路标吗? 别看美女看路标 我这有个路标检测分类的小项目日后成型后肯定可以帮你看清路标哦.(我知道开车不看美女就能看到路标,但我偏偏要放一个美女啊 嘿嘿

最新文章

  1. Eclipse 3.7 3.x SWT/Jface 开发环境搭建
  2. linux socket API / listen() 两个队列以及第 2 个参数的作用
  3. java 先序遍历_二叉树的前序中序后序遍历(java代码)
  4. 服务器自动删路由,云服务器Windows下添加、删除和修改静态路由
  5. Nacos命名空间配置_每个人用各自自己的命名空间---SpringCloud Alibaba_若依微服务框架改造---工作笔记001
  6. Cocos2d-x学习之---关于CCScrollView
  7. 保监会:关于开展2012年保险业信息系统安全检查工作的通知
  8. python 柱状图上显示字体_Python爬取百部电影数据,我发现了这个惊人真相!
  9. jquery easyUI第一篇【介绍、入门、使用常用的组件】
  10. python音频实时频谱分析_基于python的音频设计及频谱分析
  11. UVA11019 Matrix Matcher【hash傻逼题】【AC自动机好题】
  12. 给大家推荐个vs里面的小插件,自动对齐代码
  13. 2010年中兴面试题
  14. MATLAB篇之层次分析法
  15. 紫书5-16UVa212
  16. 使用内核模块添加系统调用
  17. PositiveUnlabeled Data Learning——第四弹(Semi-Supervised Classification/AUC Optimization)
  18. 递归——兔子繁殖问题
  19. sqlserver2012不允许保存更改,阻止保存要求重新创建表的更改
  20. 滑雪与时间胶囊 题解 BZOJ2753

热门文章

  1. JAVA day20、21 双列集合Map<K,V>:HashMap,LinkedHashMap,TreeMap,Hashtable, ConcurrentHashMap;JDK1.9新特性
  2. 第 4 章 设计模式概述
  3. oracler日期函数相差六个月_oracle中计算两个日期的相差天数、月数、年数、小时数、分钟数、秒数等...
  4. wxpython使用多进程_wxPython 使用总结
  5. python调用其他类中的方法_无法调用其他类中的方法
  6. mysql byte函数_mysql8 参考手册-format_bytes()函数
  7. java获取数组穷举_递归算法求解遍历(或穷举)问题
  8. integer为null_比较两个Integer,为什么必须使用equals?不用==
  9. PHP连接mysql数据库使用方法,PHP连接MySQL数据库的操作方法
  10. Vue使用v-for绑定两个属性拼接渲染界面