点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

本文转自:计算机视觉工坊

前言

视觉伺服是工业上很重要的一个领域,在自动装配、高精配准上应用非常多。针对近两年常见的算法模式,在这里进行了简单的汇总。

1、Predicting Target Feature Configuration of Non-stationary Objects for Grasping with Image-Based Visual Servoing

本文研究了RGB-D相机无法提供有效深度信息时,闭环抓取的最后逼近阶段问题,这对于当前机器人抓取控制器失灵的情况下抓取非平稳物体是必要的。

在最后的抓取姿态下,本文预测观察到的图像特征像面坐标,并使用基于图像的视觉伺服来引导机器人达到该姿态。

基于图像的视觉伺服是一种成熟的控制技术,它可以在三维空间中移动摄像机,从而将图像平面的特征配置驱动到某种目标状态。先前的工作中,假设目标特征配置是已知的,但是对于某些应用,这可能是不可行的,例如第一次对场景执行运动。本文提出的方法对抓取最后阶段的场景运动以及机器人运动控制中的误差具有鲁棒性。

2、Camera-to-Robot Pose Estimation from a Single Image(卡内基梅隆大学,代码开源)

本文提出了一种从单个图像估计摄像机相对于机器人姿态的方法。该方法利用深度神经网络对摄像机的RGB图像进行处理,检测机器人上的二维关键点,并利用区域随机化的方法对网络进行完全的模拟训练。假设机器人机械手的关节结构已知,一般使用PnP方式恢复相机外部。与传统的手眼标定系统不同,本文的方法不需要离线标定步骤,能够通过单帧计算相机外参,从而打开了在线标定的可能性。本文给出了三种不同摄像机传感器的实验结果,证明了该方法能够在单帧条件下达到比传统的多帧离线手眼标定更好的精度。通过附加帧,精度进一步提高。

3、Learning Driven Coarse-to-Fine Articulated Robot Tracking(ICRA2019)

本文提出了一种机器人关节跟踪方法,它只依赖于颜色和深度图像的视觉线索来估计机器人在与环境交互或被环境遮挡时的状态。文章假设只有在观测状态和估计状态之间建立亚像素级的精确对应关系时,关节模型拟合方法才能实现精确跟踪。以前工作只依赖于识别深度信息或彩色边缘对应作为跟踪目标,并要求从联合编码器初始化。本文提出了一种粗糙到精细的关节状态估计器,该估计器仅依赖于颜色边缘和学习到的深度关键点的视觉线索,并由深度图像预测的机器人状态分布初始化。在四个RGB-D序列上评估了论文的方法,展示了KUKA-LWR臂和 Schunk-SDH2手与环境进行交互,并证明这种组合的关键点和边缘跟踪目标可以在不使用任何联合编码器传感的情况下进行平均误差为2.5cm的手掌位置估计。

4、CRAVES: Controlling Robotic Arm with a Vision-based Economic System(CVPR2019)

训练机器人手臂来完成现实世界的任务已经引起学术界和工业界越来越多的关注。本文讨论了计算机视觉算法在这一领域中的作用并专注于没有传感器的低成本机械臂,因此所有的决策都是基于视觉识别,例如实时三维姿态估计。然而,这就需要标注大量的训练数据,不仅费时而且费力。基于该原因,本文提出了一种新的解决方案,即利用三维模型生成大量的合成数据,在该虚拟域中训练一个视觉模型,并在域自适应后应用于真实图像。为此,论文设计了一个半监督方法,充分利用了关键点之间的几何约束,并采用迭代算法进行优化。该算法不需要对真实图像进行任何标注,具有很好的推广性,在两个真实数据集上得到了不错的三维姿态估计结果。本文还构建了一个基于视觉的任务完成控制系统,在虚拟环境中训练了一个强化学习agent,并将其应用于现实世界。

5、Robot Arm Pose Estimation by Pixel-wise Regression of Joint Angles(ICRA)

为了用机械臂实现基于视觉的精确控制,需要良好的手眼协调。然而,由于来自关节编码器的噪声读数或不准确的手眼校准,了解手臂的当前配置可能非常困难。提出了一种以手臂深度图像为输入,直接估计关节角位置的机器人手臂姿态估计方法。这是一种逐帧的方法,它不依赖于前一帧解的良好初始化或来自联合编码器的知识。为了进行估计,本文使用了一个随机回归森林,它基于综合生成的数据进行训练。论文比较了随机森林的不同训练目标,并分析了手臂的先验分割对训练精度的影响。实验表明,这种方法提高了先前的工作,无论是在计算复杂性和准确性方面。尽管只对合成数据进行了训练,但这种估计也适用于真实的深度图像。

本文仅做学术分享,如有侵权,请联系删文。

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

面向高精度领域的视觉伺服算法汇总相关推荐

  1. 超详细的3D视觉学习路线汇总

    微信公众号推荐 [3D视觉工坊简介] 公众号[3D视觉工坊],致力于3D视觉算法.SLAM算法.三维重建.点云处理.深度学习.目标检测.语义分割.自动驾驶感知算法等领域的技术传播,注重内容的原创分享和 ...

  2. 3D视觉学习路线汇总

    微信公众号推荐 [3D视觉工坊简介] 公众号[3D视觉工坊],致力于3D视觉算法.SLAM算法.三维重建.点云处理.深度学习.目标检测.语义分割.自动驾驶感知算法等领域的技术传播,注重内容的原创分享和 ...

  3. Visp_ros学习笔记(三):对于视觉伺服过程中关键函数的理解

    开发环境:Unbuntu 18.04 LTS + ROS Melodic + ViSP 3.3.1   在上一篇博客中介绍了使用Pionner3dx移动机器人完成视觉伺服任务的例程,收到篇幅限制,对于 ...

  4. Visp_ros学习笔记(二):在Gazebo环境下实现Pionner3dx移动机器人视觉伺服仿真

    开发环境:Unbuntu 18.04 LTS + ROS Melodic + ViSP 3.3.1   本文主要介绍了如何实现Pionner3dx移动机器人视觉伺服仿真,仿真环境是ROS+Gazebo ...

  5. CVPR 2021| 端到端场景无关视觉定位算法(SuperGlue一作出品)

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 今天要介绍的文章是"Back to the Feature: Learning Robust ...

  6. 3D点云补全算法汇总及最新进展

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 Part 1  前言 在探讨3D 点云补全专题前,先介绍三个概念: 概念一:partial obser ...

  7. 高可靠芯片搭配视觉演算法,影像式ADAS满足车规要求

    高可靠芯片搭配视觉演算法,影像式ADAS满足车规要求 2015-12-21 18:03:27   来源:eefocus    关键字:高可靠芯片  视觉演算法  影像式  ADAS  车规要求 影像式 ...

  8. 常用机器学习算法汇总比较(完)

    机器学习入门系列(2)–如何构建一个完整的机器学习项目,第九篇! 该系列的前八篇文章: 机器学习入门系列(2)–如何构建一个完整的机器学习项目(一) 机器学习数据集的获取和测试集的构建方法 特征工程之 ...

  9. 覆盖所有领域的 Python 工具库汇总!建议收藏!!!

    文章首发于个人站点 覆盖所有领域的 Python 工具库汇总 公众号:[DreamHub] 环境管理 管理 Python 版本和环境的工具 p – 非常简单的交互式 python 版本管理工具. py ...

最新文章

  1. iOS APP提交上架最新流程(转)
  2. boost::mpl模块实现transform_view相关的测试程序
  3. 多人协作代码--公共库的引用与业务约定
  4. 【JAVA SE】第十二章 流(Stream)、IO流和文件(File)
  5. IDEA : IDEA 打开使用内存监控
  6. MySQL数据库的红黑树优化_为什么Mysql用B+树做索引而不用B-树或红黑树
  7. 避免将属性的可见属性层次结构用作用户定义的层次结构中的级别
  8. c语言第一次作业程序题pta,c语言第一次作业程序题pta
  9. 「leetcode」C++题解:226.翻转二叉树,递归法与迭代法详解
  10. magic ui3.0是鸿蒙系统吗,magicui3.1更新内容要不要升级 magicui3.0新功能体验
  11. mysql数据库存储数组_数据库索引的知识点,你所需要了解的都在这儿了
  12. linux虚拟磁带机管理,RHEL6 虚拟磁带机使用指南
  13. Atiitt 知识图谱的艺术 艾提拉著 目录 1. 常见知识图谱的处理技术 1 2. 常用的公开知识图谱如DBpedia, Freebase, Yago,Openkg等 2 3. 构建知识图谱的方
  14. html取消波浪线,PPT文字下划波浪线如何去掉?
  15. 链家租房-深圳租房分析(2/2)数据分析
  16. linux mysql统计次数_按条件计数 - MySQL统计函数记录_数据库技术_Linux公社-Linux系统门户网站...
  17. 51单片机检测温湿度并且上传到阿里云
  18. 任正非:实事求是的科研方向与二十年的艰苦努力(新年推荐)
  19. 程序员长见识需要关注的牛人
  20. 常用的sql语句(一)

热门文章

  1. 倒计时1天,2018 AI开发者报名通道即将关闭(附参会提醒)
  2. 对话云知声李霄寒:不计成本研发芯片,探索语音之外的“硬”实力
  3. 入华十年,一家互联网外企的“另类”视频广告模式
  4. BDTC 2017丨大数据在金融、交通、医疗、工业领域落地实践与应用
  5. 基于Java的疫情防控管理系统
  6. 被面试官问懵B了,十亿级数据ES搜索怎么优化?
  7. 代码生成器:IDEA 强大的 Live Templates
  8. 图解 Attention(完整版)!
  9. 灵魂拷问:你看过Xgboost原文吗?
  10. LightGBM模型_相关资料整理