#今日论文推荐# 将有色液体图像转换成透明液体,CMU教机器人准确掌控向杯中倒多少水

借助不同风格之间的图像转换,CMU 的研究者教会了机器人理解透明液体。
如果机器人可以倒液体,则可以帮助我们自动完成烹饪、将药品倒入药瓶或给植物浇水等任务。但是,透明液体在图像中很难被感知出来,完全透明的液体可以提供的唯一视觉信号是光线穿过液体的折射。此外,获得液体的深度测量同样不容易,因为液体会折射所投射的红外光。

以往的工作已经探索了机器人在各种环境下倒水,但都需要在环境或数据收集方法上做出重大妥协。透明液体细分的方法需要在训练期间加热液体,以在热成像仪观察下获得真值标签。
然而,为训练加热液体是一个单调乏味的过程,对可以轻松收集多少训练数据有限制。其他方法需要从多视角、背景、重量测量或液体运动等方面观察液体,这些施加在环境上的要求限制了这些方法的适用性。
近期,在 CMU 和圣母大学的一篇论文中,研究者提出了一种在透明容器中感知透明液体(如水)的方法。与以往方法相比,本研究提出的方法减轻了对操作域的限制。具体地,他们在单个图像上进行操作,不需要液体运动或多帧,也不需要在训练期间进行手动注释或加热液体。研究者使用一个生成模型来学习将有色液体的图像转换为透明液体的合成图像,这种做法可以用来训练透明的液体细分模型。
论文一作 Gautham Narasimhan 现为 CMU 机器人研究所的助理研究员,2020 年在 CMU 拿到了硕士学位。目前,他致力于研究用于机器人倒水任务的强化学习模型。该研究由 LG Electronics 和美国国家科学基金会提供资助,并于 5 月份发表在 IEEE 国际机器人和自动化会议上。该论文已被机器人领域国际顶会 ICRA 2022 接收。

论文题目:Self-supervised Transparent Liquid Segmentation for Robotic Pouring
详细解读:https://www.aminer.cn/research_report/62b280d97cb68b460fd87fe3?download=falsehttps://www.aminer.cn/research_report/62b280d97cb68b460fd87fe3?download=false
AMiner链接:https://www.aminer.cn/?f=cs

#今日论文推荐# 将有色液体图像转换成透明液体,CMU教机器人准确掌控向杯中倒多少水相关推荐

  1. 将有色液体图像转换成透明液体,CMU教机器人准确掌控向杯中倒多少水

    点击上方"迈微AI研习社",选择"星标★"公众号 重磅干货,第一时间送达 转载自:机器之心 后台回复"加群"进入-> CV 微信技术交 ...

  2. #今日论文推荐# 光子神经网络登上nature,图像识别速度降至1纳秒

    #今日论文推荐# 光子神经网络登上nature,图像识别速度降至1纳秒 现在,美国研究者开发的一个光子神经网络(photonic deep neural network,PDNN),让图像识别仅需1纳 ...

  3. #今日论文推荐# 谷歌DreamBooth扩散模型实现“以假乱真”,让指定实物在图像中以各种方式展现

    #今日论文推荐# 谷歌DreamBooth扩散模型实现"以假乱真",让指定实物在图像中以各种方式展现 在 AI 长期发展中,目前的文本生成图像模型有了显著提升,今年谷歌.OpenA ...

  4. #今日论文推荐# 谷歌推出DreamBooth扩散模型,可做到“以假乱真”,让指定现实物体在图像中以各种方式展现

    #今日论文推荐# 谷歌推出DreamBooth扩散模型,可做到"以假乱真",让指定现实物体在图像中以各种方式展现 在 AI 长期发展中,目前的文本生成图像模型有了显著提升,今年谷歌 ...

  5. #今日论文推荐# 多边形战士模型,微软提出19亿参数的超大通用模型BEIT-3,刷榜多个CV和多模态任务

    #今日论文推荐# 多边形战士模型,微软提出19亿参数的超大通用模型BEIT-3,刷榜多个CV和多模态任务 语言.视觉和多模态预训练的大融合正在出现.在这项工作中,作者引入了一个通用的多模态基础模型 B ...

  6. #今日论文推荐# 多边形战士模型!微软提出19亿参数的超大通用模型BEIT-3,刷榜多个CV和多模态任务

    #今日论文推荐# 多边形战士模型!微软提出19亿参数的超大通用模型BEIT-3,刷榜多个CV和多模态任务 语言.视觉和多模态预训练的大融合正在出现.在这项工作中,作者引入了一个通用的多模态基础模型 B ...

  7. #今日论文推荐# 用GNN做CV三大任务的新骨干,同计算成本性能不输CNN、ViT与MLP|中科院华为诺亚开源

    #今日论文推荐# 用GNN做CV三大任务的新骨干,同计算成本性能不输CNN.ViT与MLP|中科院&华为诺亚开源 用图神经网络(GNN)做CV的研究有不少,但通常是围绕点云数据做文章,少有直接 ...

  8. #今日论文推荐# 文字秒变3D?苹果发布最新AI生成模型GAUDI,根据文字提示创建3D场景

    #今日论文推荐# 文字秒变3D?苹果发布最新AI生成模型GAUDI,根据文字提示创建3D场景 继 AI 将文字变成图片后,又有 AI 可以将文字变成 3D 场景了. 苹果发布新 AI 系统 GAUDI ...

  9. #今日论文推荐#1小时学会走路,10分钟学会翻身,世界模型让新生机器狗掌握多项技能

    #今日论文推荐#1小时学会走路,10分钟学会翻身,世界模型让新生机器狗掌握多项技能 人类宝宝在出生后的第1年里,就会逐渐掌握协调能力,学习坐.立.翻滚和爬行. 那么机器人呢? 机器人能完成多复杂的任务 ...

最新文章

  1. Keras Lambda层
  2. UITextField长度限制的写法
  3. 理解一下jQuery.extend()和jQuery.fn.extend()方法
  4. js如何判断当前文本的输入状态——中文输入法的那些坑
  5. 百万数据报表导出:使用SXSSFWorkbook完成百万数据报表打印
  6. openpyxl 读写 excel
  7. c语言第四阶段在线作业,中石大(华东)12春(41400) 《C语言》第四阶段在线作业(自测)...
  8. cmd mysql出现乱码怎么解决方法_cmd如何解决mysql乱码
  9. mysql 5.7.11 压缩包安装办法遇到故障后彻底卸载办法
  10. 我是如何在自学编程9个月后找到工作的
  11. 单招面试计算机专业技巧,单招面试技巧 单招好不好
  12. css-图片模糊处理
  13. 卫星轨道的计算是利用计算机的,轨道计算
  14. java8 treemap 排序_java中TreeMap排序的示例代码
  15. 中国人寿研发中心笔试JAVA开发
  16. 超级计算机控制人的电影,想知道这部电影的名字,讲述通过超级计算机进入人脑.回到过去.其中有个老教授死亡留下一封信给给主角。...
  17. 展锐camera 调用流程
  18. SWFObject文件上传使用记录
  19. 10亿美元生态圈现雏形 巨头热议虚拟经济全球化
  20. 一篇小学生作文《我的爸爸在华为》,看哭无数人!

热门文章

  1. 树莓派使用create_ap创建局域网
  2. python学习日志3--ARIMA时间序列模型预测
  3. vue项目实现表格定时滚动
  4. 产品黑魔法:腾讯搞流量的重要一课
  5. App在后台被杀死后重启-重进首页方法
  6. 基于PHP+Html+mysql的客户关系管理CRM系统 文档+项目源码及数据库文件
  7. 狮子,狼,羊群的故事
  8. 解决关于VS无法加载解决方案中的项目的问题
  9. 没有基础可以学画插画吗?怎么学?
  10. 【短链接】——新浪、百度、搜狐等官方长链接转短链接