贾浩楠 发自 凹非寺
量子位 报道 | 公众号 QbitAI

用你的AI算法和小白鼠一较高下,还能赢得3万美元(20万元)奖金。

稳赚?快别这么想。

实际情况是,机器学习算法一般都是在给定条件的任务中有较好的表现,但现实情况则要复杂很多。举例来说,一个老鼠在迷宫中或有遮挡的环境中寻找食物的表现要比一个AI好得多。

DeepMind就以动物认知测试为基础开发了一套强化学习任务集Animal-AI,用来供开发者测试自己的AI模型实用性。

前两天,Animal-AI2.0版本上线,并且在Github开源。

AI算法:我不如狗

游戏环境经常被用来评估AI的“能力”。

一般都是给定状态转移概率( state transferring probability)和奖励函数,在这样的条件下来测试模型表现。

那真实的世界真的是这样的吗?

当然不是,真实的世界要复杂地多,在面对复杂任务时,动物的表现往往优于AI。

比如下图,简单的把食放在一个透明管中,狗能明白把头伸进管子里就能获得食物,而一个强化学习AI完全懵了。

DeepMind研究人员基于动物认知的研究开发了这个测试环境,旨在让强化学习算法的开发者,通过动物的行为模式中获得启发,改善算法性能。

这个项目包含了训练环境、训练库以及900个测试和/或训练任务。900个任务由浅入深,被分为不同的类别,以反映不同的认知能力。

该环境使用Unity ml-agent建立。其中包含一个固定大小的竞技场,和一个已经训练好的模型。

竞技场中包含各种物体,包括正负奖励(绿色、黄色和红色球体)、障碍物、雷区、不同的地形等。你的AI任务是在场地中收集正激励(黄绿球)。

安装教程

Animal-AI可以在Mac、Linux、Windows上运行,要求Python3。

首先安装必要运行环境,Github项目主页提供了不同系统的环境下载:

将安装包解压到examples/env文件夹下。Linux系统可能需要先运行一行代码:

chmod +x env/AnimalAI.x86_64

Animal-AI包里面是一个Unity环境交互应用接口,包括一个gym环境、一个扩展Unity ml-agent环境。通过以下代码安装:

pip install animalai

项目还提供一个可以用来训练模型的包,通过以下代码安装:

pip install animalai-train

环境配置好以后,在examples路径下运行:

pip install -r requirements.txt

启动jupyter notebook并运行environment和training。

测试实例

这里测试的算法是在2019年Animal-AI Olympic大赛中获得第一名的算法。

一个简单的寻找食物的任务:

更进一步,在一个有静止负激励的复杂环境中寻找食物,AI面对复杂环境时直接卡死在场地右下角:

让红色的球(负面激励)动起来,AI需要在动态环境中寻找食物:

再增加难度,使环境更复杂,可以看到AI直接卡死在角落里了:

一个Y型迷宫:

工具使用(这个任务中,AI必须使用跷跷板才能收集到食物):

这种复杂的任务绝大部分AI都无法完成,不是围绕红区直至时间耗尽,就是直接卡死在墙角。

可以看到,低等级的动物行为测试任务,一般的AI都能完成,而稍微加大难度,AI就会「无所适从」,直接卡死,这一系列任务让不少满怀信心的AI开发者铩羽而归。

项目的开发者发起了Animal-AI Olympics,征集全世界的强化学习AI才挑战这些任务,奖金高达3万美元,2019年的比赛已经结束。

可以看到,第一名平均分也只有43.7,在复杂决策,比如避障、因果推理等项目上得分都很低。

组织者还计划在2021年举行第二届大赛,你是否准备好用自己的强化学习算法去赢取这3万美元了呢?

传送门

项目地址:
https://github.com/beyretb/AnimalAI-Olympics

Animal-AI Olympics比赛详细信息:
http://animalaiolympics.com/AAI/2019

作者系网易新闻·网易号“各有态度”签约作者

如何关注、学习、用好人工智能?

每个工作日,量子位AI内参精选全球科技和研究最新动态,汇总新技术、新产品和新应用,梳理当日最热行业趋势和政策,搜索有价值的论文、教程、研究等。

同时,AI内参群为大家提供了交流和分享的平台,更好地满足大家获取AI资讯、学习AI技术的需求。扫码即可订阅:

了解AI发展现状,抓住行业发展机遇

AI社群 | 与优秀的人交流

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

只要你的AI算法能比小白鼠聪明,DeepMind的这20万奖金请拿走相关推荐

  1. (算法练习)——小白鼠排队

    要求: http://codeup.cn/problem.php?cid=100000581&pid=5 说明: 现在每次提了代码之后盯着那个评分的圈一直转,看到绿色简直快哭出来= = 这一题 ...

  2. 【AI学霸榜】世界名校十大学霸获200万奖金,NLP、CV等四大领域学术秘籍曝光

    点击有惊喜 1月22日,2017年度百度奖学金颁奖典礼在百度科技园举行,10位来自世界名校的候选人平分200万人民币奖金. 经过从初选到答辩的层层选拔,来自清华大学的王奕森和林衍凯.北京大学的王云鹤. ...

  3. 90 后美女独家秘籍:从小白到 AI 算法工程师

    这是一篇关于如何成为一名AI算法工程师的长文~ 经常有朋友私信问,如何学python呀,如何敲代码呀,如何进入AI行业呀? 正好回头看看自己这一年走过的路,进行一次经验总结. 来看看你距离成为一名AI ...

  4. 开源!《AI 算法工程师手册》中文教程正式发布!

    作者 | 红色石头 转载自 AI有道(id:redstonewill) 最近红色石头在浏览网页的时候,偶然发现一份非常不错的 AI 资源,就是这本<AI 算法工程师手册> .本文将给大家推 ...

  5. DeepMind、哈佛造出了 AI「小白鼠」,从跑、跳、觅食、击球窥探神经网络的奥秘...

    机器之心报道 机器之心编辑部 我们可以用研究小白鼠的方式来研究 AI 吗?或许可以.在一篇 ICLR 2020 Spotlight 论文中,DeepMind 和哈佛大学的研究者构建了一个基于 AI 的 ...

  6. 微软开源: 老旧照片修复的AI算法

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 开源最前线(ID:OpenSourceTop) 猿妹整编 | 来源 ...

  7. 成为大厂AI算法工程师,“NLP/CV”都是你必须过的坎!

    前言:第二期课程在2019年2月结课,第一期.第二期具有求职意向的同学中,目前已经有80%的同学拿到了国内外名企的AI算法岗位offer,或者国外名校的AI 硕士录取 offer.在大家的认可下,我们 ...

  8. 2019 年入门AI算法工程师,你需要掌握什么技能?

    一篇推文,感兴趣的同学可以了解一下,有需要请继续往下阅读,没有需要的打扰各位金主了 ----- 人工智能与自然语言处理/计算机视觉课培训招生 Artificial Intelligence ForNL ...

  9. 想入职AI算法岗?BAT的工程师去学了这门课

    前言:第二期课程在2019年2月结课,第一期.第二期具有求职意向的同学中,目前已经有80%的同学拿到了国内外名企的AI算法岗位offer,或者国外名校的AI 硕士录取 offer.在大家的认可下,我们 ...

最新文章

  1. c# 取两个时间的间隔
  2. 一文看懂深度学习模型压缩和加速
  3. 【Java例题】2.1复数类
  4. mysql 查询if语句执行顺序_MySQL 语句的执行顺序
  5. LeetCode 2086. 从房屋收集雨水需要的最少水桶数(贪心)
  6. MySQL数据库基础(mysql数据类型、数据表的操作)
  7. 检索 COM 类工厂中 CLSID 为 {00024500-0000-0000-C000-000000000046} 的组件时失败,原因是出现以下错误: 80070005。...
  8. Oracle采用自己的公有云作为ZFS阵列的后端存储
  9. 史上最详细MySQL5.5复制配置步骤,与以前版本的有所不同
  10. latex字母/数字双线字体
  11. app图标圆角角度_iOS和安卓APP启动图标的尺寸和圆角大小详解
  12. 情商和逆商比智商更重要
  13. Java判断手机号格式是否正确
  14. \u开头的字符串是什么意思?
  15. 用什么软件可以修改PDF文件,软件的操作方法
  16. R语言画图,根据正负值画不同颜色,并且画水平线或者垂直线
  17. nodejs PM2监控及报警邮件发送(二)
  18. DAPI(Distributed Application Program Interface)
  19. 为什么要使用高彩模式
  20. 带你去看不一样的《西游记》

热门文章

  1. 最近后缀.Scaletto,.com}KBK,com}BET,.Fuchsi勒索病毒开始爆发…
  2. gj11 多线程、多进程和线程池编程
  3. 监控MySQL数据库的主从状态的shell脚本
  4. Android热修复之 阿里开源的热补丁
  5. Atitit hsv转grb  应该优先使用hsv颜色原则 方便人类
  6. Kubernetes 落地案例|使用 Kubernetes 重新部署全球最大的教育公司
  7. Windows学习总结(3)——成为电脑高手必备的cmd命令大全
  8. CSharpGL(22)实现顺序无关的半透明渲染(Order-Independent-Transparency)
  9. iOS如何转换十三位的时间戳
  10. Ecshop文章列表页显示内容摘要