DeepMind大放送:开放4个多物体表征学习数据集,还有一篇智能体新研究
铜灵 发自 凹非寺
量子位 出品 | 公众号 QbitAI
“专注开源一百年”的DeepMind,今天又有了新动作。
这次连环放送包含的新物件不少:四个多物体表征学习数据集,还有一个能在强化学习中有效利用演示解决难题的智能体新研究。
具体来看。
多物体表征学习数据集们
这是4个多物体表征学习数据集,可用于开发场景的分解方法,如MONet模型和IODINE。
MONet(简称“莫奈”)是DeepMind今年3月发布的神经网络,它把每个物体,圆满地从背景里分离出来。这样的技能,完全是在无监督的学习过程中解锁的。
就像下面这样:
IODINE (简称“碘”) 是与莫奈一同发布的,也是无监督网络,也可以让画面里的每一个角色随意奔跑。
而新发布的这四个数据集,就可以与莫奈与碘配合使用。
研究人员表示,这个数据集由多个物体场景组成,每张图像都包含场景中所有物体的ground-truth分割蒙版。
研究人员还为每个物体提供了生成因子(generative factors)促进表征学习。生成因子包含了描述和渲染场景中出现物体的所有必要和充分特征(Feature),包括大小、颜色和位置等。
此外,segmentation_metrics模块中包含调整后Rand index的TensorFlow实现,可用于比较推断物体分割和ground-truth分割蒙版。
这些代码已经经过内部测试,与TensorFlow r1.14配合服用效果更佳。
数据集四胞胎的大娃叫Multi-dSprites,大小500MB到1GB之间,是一个基于精灵图的数据集。
在计算机图形学中,当一张二维图像集成进场景中,成为整个显示图像的一部分时,这张图就称为精灵图。所以在这个数据集中,多个物体是椭圆形、心形或者方形的图片。
这个数据集由三个版本,每个版本有1M数据点。每个数据点包含图像、背景和物体蒙版,以及ground-truth特征。
二娃是Objects Room,这个数据集基于生成查询网络(Generative Query Network)的MuJoCo 环境,是3D形状数据集的多物体扩充。
每个场景中包含2种元素:1间由天花板、墙壁和地板组成的空房,最多六个物体,并且颜色随机、样式随机。训练集大小为7GB,测试集在6-8MB之间。
三娃是CLEVR (with masks),这是基于此前的Clever数据集改造的,可以生成ground-truth分割蒙版。
数据集中的图像和蒙版规模为320×240大小,整个数据集大小为10.5GB。
四娃是Tetrominoes,这是一个类似俄罗斯方块里形状的数据集,大小为300MB。
每个形状都由四个方块组成,总共有17种排列。颜色有6种选择,分别为红绿蓝黄品红青。
研究人员用x和y坐标进行定位,用shape和color(整数编码)代码块为ground-truth特征。数据点还包括一个visibility向量。
还有新论文
DeepMind开源动作频频,除了这些数据集,这两天还公布了一项新的智能体研究。
在论文Making Efficient Use of Demonstrations to Solve Hard Exploration Problems中,研究人员提出一种能够利用演示解决部分可观测环境中硬探测问题的智能体:R2D3。
研究人员R2D3利用演示解决高度可变的初始环境中的稀疏奖励任务,并用8项任务进行测试展示了智能体的有效性。
值得一看~
传送门
数据集GitHub地址:
论文地址:
今天的DeepMind大放送就到这了~
— 完 —
加入社群 | 与优秀的人交流
![](/assets/blank.gif)
小程序 | 全类别AI学习教程
![](/assets/blank.gif)
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
喜欢就点「好看」吧 !
DeepMind大放送:开放4个多物体表征学习数据集,还有一篇智能体新研究相关推荐
- 【数据资源】遥感资源大放送(下)| 11 个经典遥感数据集
By 超神经 内容提要:利用遥感影像进行土地类别分型,最常用的方法是语义分割.本文继上期土地分类模型训练教程之后,又整理了几大主流公开遥感数据集. 关键词:遥感数据集 语义分割 机器视觉 在上 ...
- 遥感资源大放送(上):用开源代码,训练土地分类模型
教程传送门 遥感资源大放送(下)| 11 个经典遥感数据集 遥感影像是开展测绘地理信息工作的重要数据,对于地理国情监测.地理信息数据库更新等意义重大,在军事.商业.民生等领域发挥了越来越重要的作用. ...
- Windows live messenger (WLM)邀请大放送--MSN8.0版(有条件)
Windows live messenger (WLM)邀请大放送--MSN8.0版(有条件) [新年贺礼]Windows live messenger (WLM)邀请大放送--MSN8.0版 MS ...
- 百万在线人数 服务器搭建_赛博朋克2077在线人数破百万,美术资料大放送
游戏公司的老板们请注意! 今天如果有员工请假 80%是为了肝这款游戏! 完成了一年三连跳的"壮举"后<赛博朋克2077>终于来了! 万众期待的2077于今日早上8点正式 ...
- 阿里系唯一对外开放数据分享平台天池数据集2020收官精品合集大放送
**简介:**阿里系唯一对外开放数据分享平台天池数据集2020收官精品合集大放送 作为国内"AI众智"首选平台,阿里云天池除了面向国内开发者组织大数据竞赛.免费开放AI学习内容.提 ...
- ERP专业词汇大放送
ERP专业词汇大放送 中英文对照的ERP专业词汇介绍:B2C.B2B.ASP.APS.BOM.C/S.CAD.CAM.CPC.EDI.GUI.ISO.MIS. PM.SCM.SQL.TQM.line ...
- 【云栖大会精华汇】历届云栖大会精彩资料大放送,一篇看尽云栖大会前世今生...
[热点头条] 历届云栖大会精彩资料大放送,一篇看尽云栖大会前世今生 如果从2009-2010年算起,2017杭州云栖大会已经是第八届.为帮助更多朋友认识云栖大会,云栖社区特别整理了历届云 ...
- 【算力大放送2】GPU 专属服务器使用教程!!!
关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 昨天,已给大家放送了如何获取免费GPU的方法,可以查看[算力大放送]专属 GPU ...
- 【资源放送】机器学习/深度学习最全公开视频大放送!
文章首发于微信公众号<有三AI> [资源放送]机器学习/深度学习最全公开视频大放送! 该篇小记一下机器学习与深度学习的一些好的基础视频资源. 如果你是刚入门的小白,建议细细阅读一下下面将要 ...
最新文章
- mysql 定义存储过程_mysql——定义——存储过程和函数——概念
- jquery easyui datagrid 排序列
- 阅《领域驱动设计与设计模式实战》
- sscanf函数中类型不匹配警告引发的BUG和思考
- python定义一个圆_Python-矩形和圆形
- matlab编程数学基础,数学软件 Matlab ——编程基础(脚本).ppt
- python Demo 01 爬取大学名称
- leetcode 65. 有效数字(正则表达式)
- TF-IDF 提取文本关键词
- 需要在html上引用脚本文件myjs,需要在 html 页面上引用脚本文件myJs.js,下列语句中,正确的是()...
- 在eclipse中引入jquery.js文件报错的解决方案
- 运动场馆SAAS系统运营中心、球馆、场馆、体育馆、场地配置、场馆配置、场次、报名记录、已锁场次、积分商城、会员明细、财务报表、系统打款、价格设置、消费明细、活动报名、创建场馆、权限管理、后台管理
- Nginx中间件web服务安装
- 10000以内的素数。
- w3cschool实战答案
- 有限元法基本思想和分类
- 江苏事业单位计算机类考申论吗,笔试将近!2020年江苏事业单位统考你要注意!...
- 【OpenCV入门教程之十一】 形态学图像处理(二):开运算、闭运算、形态学梯度、顶帽、黑帽合辑
- 【STUDY】工程数学
- macOS:删除DNS
热门文章
- js数组中forEach/some/every/map/filter/reduce的区别
- 牛客网平台常州大学新生寒假训练会试
- tunctl used bridge sub interface network used with multi-network env
- 汇编指令mrs_汇编指令 - Mrs.kang - 博客园
- python环境离线复制_Python 离线环境
- illegal base64 character 3a_双11华硕多款产品再送豪礼 高端硬件通吃最新3A大作
- iOS 11开发教程(二十二)iOS11应用视图实现按钮的响应(2)
- Web应用扫描工具Wapiti
- BeagleBone Black快速入门教程
- Unity 2D游戏开发快速入门(内部资料)