AMiner论文推荐:
论文标题:DMotion: Robotic Visuomotor Control with Unsupervised Forward Model Learned from Videos
论文链接:https://www.aminer.cn/pub/6047519991e0116b67c79107?f=cs
在机器人控制、基于模型的强化学习领域,学习环境的模型是重要的问题。现有方法学习环境模型通常需要大量从环境中采集的带标签的数据,如智能体动作、物体位置、运动的真实标注,在许多现实场景的应用中有局限性。
而认知科学的研究认为,人类婴儿能够仅通过视觉观察,建立物理世界的模型、进行预测。无监督地建立物理模型能够帮助人类与环境交互、操控工具来完成各种任务。如图1的例子所示:玩家 B 通过观察玩家 A 操作,学习如何玩一个游戏。为学会玩游戏,玩家 B 需要建立游戏的模型,知道键盘上的操作(动作标注)与画面中主角动作的对应关系、采取某个动作会如何影响游戏的状态。现实中,玩家 B 大部分时间都会只关注游戏画面,而不去观察玩家 A 操作键盘的每一个动作。对游戏模型的理解,例如哪个是主角、主角和游戏环境是怎么互动的,大多是通过观看游戏画面完成的;观察键盘的操作仅仅是为了知道如何去控制主角的每个动作。
受此启发,我们研究如何利用缺少动作标注的视频数据学会环境模型,来实现基于模型的机器人运动控制。如下图所示,我们提出的方法(DMotion)首先从无监督的视频中解耦智能体的运动、学习物体之间的交互规律;最后通过少量的带有动作标注的数据,DMotion 建立动作标注到智能体运动的映射,学会环境模型。
AMiner,让AI帮你理解科学!

AMiner论文推荐:相关推荐

  1. AMiner论文推荐——Large-scale Localization Datasets in Crowded Indoor Spaces

    AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现.智能指派.学术地图等科技情报专业化服务.系统2 ...

  2. AMiner论文推荐——Image Cropping on Twitter

    AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现.智能指派.学术地图等科技情报专业化服务.系统2 ...

  3. AMiner论文推荐——3D Spatial Recognition without Spatially Labeled 3D

    AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现.智能指派.学术地图等科技情报专业化服务.系统2 ...

  4. AMiner论文推荐

    论文名称:Learning Statistical Texture for Semantic Segmentation 论文地址:https://www.aminer.cn/pub/604748409 ...

  5. 【Aminer论文精读训练营】Aminer第二期推荐的5篇论文

    AMiner论文推荐: 1.概述 作者提出一种鲁棒性无监督的学习算法,利用词嵌入的结构相似性,采用迭代计算的方式提高词嵌入的质量,使得不同语言中的同样的词,它的词嵌入相似性也高. 2. 研究内容 作者 ...

  6. AMiner会议论文推荐第三十五期

    AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现.智能指派.学术地图等科技情报专业化服务.系统2 ...

  7. AMiner会议论文推荐第五十一期

    AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现.智能指派.学术地图等科技情报专业化服务.系统2 ...

  8. AMiner 会议论文推荐第十八期

    AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现.智能指派.学术地图等科技情报专业化服务.系统2 ...

  9. AMiner 会议论文推荐第十一期

    AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现.智能指派.学术地图等科技情报专业化服务.系统2 ...

最新文章

  1. Redis集群管理方式
  2. 对象冒充_使用您的精神探照灯进行冒充冒名顶替综合症
  3. attention的query、key和value的理解
  4. 快速谱峭度matlab,一种基于快速谱峭度分析的泵潜在空化故障检测方法与流程
  5. warning: format not a string literal and no format arguments
  6. Win32 远程线程
  7. .和- 区别(C++)
  8. Python DearPyGui 多线程与异步
  9. Sound Studio for Mac - 音频编辑处理工具
  10. EncryptPad—Linux中好用的加密文本编辑器
  11. JetBrains Resharper VS2017 破解方法(License Server 破解方法)
  12. 2021华为软件精英挑战赛(粤港澳赛区复赛第八)
  13. 【C++软件开发】面试经典题目汇总
  14. Oracle 10g安装图解教程
  15. 什么是网络分析仪?它的重要技术指标有哪些?
  16. php毕业论文总结,毕业设计总结
  17. 周志华揭开机器学习本质的57张PPT
  18. 28. 尚融宝借款额度审核
  19. java 简单框架_最简单的Java框架
  20. 卡方检验——离散型特征相关性分析

热门文章

  1. Android App开发动画特效中帧动画和电影淡入淡出动画的讲解及实战(附源码和演示视频 简单易懂)
  2. 华为8.19笔试题目分析
  3. CNCF宣布TUF项目正式毕业
  4. 【SDX62】WCN685X hostapd配置WPA2/WPA3混合模式,WPA3连接成功,只支持WPA2的设备连接失败问题分析及解决方案
  5. 盘点:怀一胎和怀二胎的4点不同
  6. 进程管理API之pid_nr/pid_vnr/pid_nr_ns
  7. excel基于一列的值统计另一列数值的个数
  8. 北京2008年奥运会体育图标
  9. 50本关于软件测试的书籍
  10. 内存数据库-H2简介与实践