来源:机器人大讲堂
本文约1000字,建议阅读5分钟
本文为你分享首次将内在触感与强化学习结合。

人类天生拥有先进而灵活的手部操纵能力,能够轻松完成日常很多动作,例如移动物体、开门、打字、绘画等。

但对机器人来说,要实现多任务操控,并根据不同物体适应最合适的抓握手势,这可是件难事。

那该如何控制机械手实现日常操作呢?

很多灵活强大的机械手使用了无模型强化学习技术(RL)来进行精确抓握,这种方法通用性很强,它无需过多假设,而且能自动掌握很多技能。由于这种方法除了建立函数无需其他信息,所以很容易在改进后的环境中重新学习技能,例如更换了目标物体或机械手。

但大部分情况下,这种策略需要外部传感信息,例如,用多摄像头系统来跟踪手指或物体,然而这种系统很难部署在实验室以外的环境。

为了解决该问题,哥伦比亚大学机器人操作和移动实验室的研究人员首次将无模型强化学习技术(RL)与本体触觉反馈相结合,在没有任何外部信息、机械手也不知道物体形状的情况下,仅利用“触觉感知”就能灵活操纵物体。

无需提前了解抓握物体,也能灵活适应形状

将触觉反馈与强化学习集成在一起,本身就是一个挑战。

触觉反馈通常是高维的,这会极大地增加强化学习所需的训练样本数量。因此,大多数使用强化算法控制机械手的工作要么完全避免使用触觉反馈,要么考虑需要较少训练样本的任务。

为了避免大量的训练样本,研究人员考虑仅使用内部感知,不关注被抓物体的形状,而是专注于让机械手学习手指手势(包括手指替换和重新抓握的操作)和手指旋转(涉及手指抓握中的物体的操作)技能,这些不受手的运动学约束的限制,可以实现潜在的物体形状重新定向。

这个机械手并不包含手掌,所以可将手指的手势学习主要集中在主轴旋转,然后为每个轴获得的手指采集策略以适当的顺序组合,以实现目标方向的期望变化。

稳定抓取采样,减少随机性

仅用内部感知学习手势的方法有一定的缺点:行动随机化。

随机的探索动作容易扰乱精确抓握的物体的稳定性,导致其掉落,因此需要对手指位置稳定抓取采样(SGS),以训练稳定的抓握轨迹。

为了对手部姿势进行采样,研究人员首先对物体周围的环内指尖位置进行采样,该环以物体为中心并与其部分重叠,因此指尖接触物体和保持自由的概率大致相同。通过这个过程,不仅可以找到与手指步态和手指旋转相关的稳定抓握,还可以提高发现它们的可能性,从而最大限度地减少训练时间。

第一个将内在触感与强化学习结合的实例

这项研究的预印本发表在arXiv上,论文标题为《On the Feasibility of Learning Finger-gaiting In-hand Manipulation withIntrinsic Sensing》。

为了促进未来在真实场景中的部署,限制外部视觉或跟踪传感器等信息是很有必要的。这项研究是第一个成功地使用仅内在传感信息进行训练的机械手实例,论文的第一作者,Gagan Khandate认为:“这项工作是迈向未来机械手操纵方向的非常有用的一步,不仅如此,我们在不使用手掌或其他表面进行被动支持的情况下,也能实现机械手的稳定操作技能。”

论文链接:

https://arxiv.org/abs/2109.12720

编辑:于腾凯

哥伦比亚大学「机械手」无需提前了解抓握物体,也能灵活适应形状!相关推荐

  1. 网络适配器无法建立连接_「图」KB4515384更新令人抓狂:网络适配器又无法启用...

    适用于Windows 10 May 2019(Version 1903)的累积更新KB4515384于今年9月10日发布,重点修复了Cortana进程CPU占用率过高的问题,并引入了其他的常规修复.在 ...

  2. 高精地图,养不起的 「 奢侈品 」

    业内常说,高精地图和激光雷达是自动驾驶车辆的两根拐杖. 依靠激光雷达的感知力与高精地图的规划力,车企快速搭建了高超前智能驾驶功能. 以高精地图为例,有了 HAD Map 的自动驾驶,就像开启了「上帝视 ...

  3. 数形结合「求解」希尔伯特第13个数学难题

    法布是芝加哥大学(University of Chicago)的一名拓扑学家,他对自己最近的在某个问题上的一次失败感到非常高兴. 有一个问题是德国数学家大卫 · 希尔伯特在20世纪初预测的23个当时尚 ...

  4. 电商巨头的「隐秘」战场

    当竞争在「水面」下展开,手握数据的电商巨头,角色变了. 2020 年末,电商巨头们陆续披露了一些「相似」的销售战绩. 双十一中,京东小家电销售排行前三的产品,均为京东联合品牌商共同打造的:基于淘系大数 ...

  5. 「一夜白头」有科学依据了,减压可返黑 | 哥伦比亚大学最新研究

    丰色 发自 凹非寺 量子位 报道 | 公众号 QbitAI 古有伍子胥过韶关一夜白头,今有不少人写论文头发一抓掉一把. 人生这许多烦恼都淋漓尽致地体现在脑袋上这"几根毛"上了. 不 ...

  6. 一年只有0.001「薇」!杜克大学陈怡然教授自嘲「科学家不如带货」

    来源:新智元 最近,国内直播带货一姐薇娅偷逃税被罚了! 杭州市税务局稽查局查明,网络主播黄薇(网名:薇娅)在2019年至2020年期间偷逃税款6.43亿元,其他少缴税款0.6亿元,依法对黄薇作出税务行 ...

  7. 【考研】 2021年哈尔滨工业大学计算机考研「初试」经验贴

    2021年哈尔滨工业大学计算机考研「初试」经验贴 0. 写在前面 1. 复习资料 1.0 资料下载 2. 个人复习经验 2.1 考研政治 2.1.1 基础阶段 2.1.2 强化阶段 2.1.3 冲刺阶 ...

  8. 建造自己的「天空之城」,密歇根大学博士后的这项研究可以虚空造物、偷天换日...

    来源:机器之心 哈尔的移动城堡?天空之城?这幅图是否让你想起了这两部电影中的场景--上:<天空之城>剧照:下:<哈尔的移动城堡>剧照.是电影场景变为现实了吗?真的有人建造了一座 ...

  9. 如何打造一个自己的「天空之城」,密歇根大学博士后教您虚空造物、偷天换日!...

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 看过宫崎骏动画电影<天空之城>的小伙伴,想必偶尔会向往那座神秘的空中岛屿拉普达吧. ...

最新文章

  1. JSP在动态网页上输出 三角形和菱形
  2. xshell 6和xftp 6的下载和使用
  3. 关于知识蒸馏,你想知道的都在这里!
  4. c语言作业请输入一个运算符,C语言书面作业1(有答案版)..doc
  5. python计数器函数_Python计数器Counter
  6. Java高并发之BlockingQueue
  7. 数学家比10个师更有威力?
  8. 手机秒变IoT设备?——巧妙利用阿里云物联网平台
  9. linux中如何让vim永久显示行号(永久显示+临时显示)
  10. python专业方向 | 文本相似度计算
  11. 使用免费ip代理进行投票
  12. SQL Server 游标运用:查看所有数据库所有表大小信息(Sizes of All Tables in All Database)...
  13. Android 使用POI导出Excel表格
  14. E-mail计算机实验报告,邮件发送实验报告
  15. 【渝粤题库】广东开放大学 期货与期权 形成性考核
  16. 三国论(16-20章)
  17. 10分钟明白为什么要使用微服务
  18. 动画:面试官问我 JS「变量提升」我头皮发麻,最后把这篇动画甩给了他
  19. N63043-郝子轩-第二周
  20. 文件锁(三)——文件锁的原理

热门文章

  1. 【团队】 冲刺一(10/10)
  2. js中为什么你不敢用 “==”
  3. 百篇大计敬本年之C++坎坷之路 —— Warning:will be initialized after [-Wreorder]
  4. Splunk 会议回想: 大数据的关键是机器学习
  5. UnicodeEncodeError: 'ascii' codec can't encode character....
  6. angularJs 前端的页面分解与组装
  7. 微软私有云分享(R2)26配置基线与更新
  8. Logical Volume Manager in Linux ( Create, Displ...
  9. jwt认证机制优势和原理_最详细的Spring Boot 使用JWT实现单点登录
  10. rancher安装mysql_四、rancher搭建Mysql集群化部署,做到同步备份