• 论文地址
    chrome-extension://cdonnmffkdaoajfknoeeecmchibpmkmg/assets/pdf/web/viewer.html?file=https%3A%2F%2Fapril.eecs.umich.edu%2Fmedia%2Fpdfs%2Folson2011tags.pdf

  • Apriltag是改进的ARToolkit、 ARTag

    • ARToolkit的劣势

      • 每个模板都是独立的,所以校正操作非常慢。
      • 每一个合适正交直线的图像创建模板是非常困难的。
      • tag获取的时候通过用户设定的阈值得到一个简单的二值化图像。易受光照影响,而且识别不了有适当遮挡的标签边缘。
    • ARTag对ARToolkit的改进
      • 使用图像梯度来获取tag,这样对光照的鲁棒性更强。
      • ARTag算法不开源
  • AprilTag主要组件

    • Tagdetector

      • 估计图像中可能的标签位置(内黑外白的四边形区域),为了方便识别标签的黑白边缘特征。尽可能多的检测出所有可能的标签。

      • 线段检测:计算每个像素点的梯度方向和幅值,并把具有相似梯度幅值和方向的像素聚类。这种方法可以在一半的图像分辨率提升4倍的速度。

        在相邻像素之间添加边缘,边缘的权重等于梯度方向上的像素差。然后这些边缘按照增加的边缘权重进行排序和处理:对于每条边缘,我们测试像素所属的连接组件是否应该连接在一起。

        此算法对噪声敏感,甚至适当的噪声会导致局部梯度不同,约束部件增长。可以对图像进行低通滤波处理。这个滤波会模糊一些有用的信息,tag的边缘本质上是一个很大的特征,所以滤波不会导致信息丢失,建议设置值为0.8。

        使用加权最小二乘法拟合直线段。

        线段的方向通过梯度的方向来决定,因此线段的左边是暗部,右边是亮部。线段的方向在线段的中部短的垂直槽口来直观表示,注意这些槽口总是指向亮得区域。

      • 四边形检测:基于一个深度为4的递归深度优先搜索算法,每一层搜索添加一个边缘到四边形。在第一层深度,考虑所有的线段。在第二层到第四层,考虑所有的线段从“完全闭合”之前线段结束的地方开始,并且服从一个逆时针缠绕顺序。

        通过线段检测已经得到了一组有向线段,四条线段组成一个候选四边形。

        检测到的四边形包括:a.三个标签边缘加上一条纸张边缘;b.一个有效的载荷位。这两种情况因为编码无效将被丢弃。

    • 计算tag相对于相机的距离与角度

      • 单应性变换和外参估计

        通过DLT算法计算得到单应性矩阵(3*3大小),将一个点从2D标签坐标系映射到2D图像坐标系。

        计算标签相对于相机的位置和方向需要附加信息:a.相机的焦距;b.标签的物理尺寸。

        3 * 3的单应矩阵(由DLT计算)可以写成3 * 4的相机投影矩阵P(通过相机标定得到)和外参矩阵E的乘积。s是未知比例因子

        展开:

        这样就容易得到Rij和Tk了,除了未知的比例因子s。

        然而, 由于旋转矩阵的列必须都是单位幅值,我们可以限制 s 的大小。我们有两列的旋转矩阵, 所以我们计算 s 为他们幅值的几何平均值。标记s可以重新获得通过请求在相机前的tag。即Tz < 0。旋转的第三列矩阵可以通过计算交叉乘积来恢复两个已知列, 因为旋转的列矩阵必须是正交的。

    • 编码系统

      • 从有效负载字段中读取位。我们通过计算每个字段的tag相对坐标系,利用单应矩阵将它们转换为图像坐标,然后对结果像素进行阈值化。我们建立了 “黑色” 像素的强度的空间变化模型, 以及第二个模型的强度"白色" 模型。我们使用标签的边框, 它包含白色和黑色像素的已知示例。

        使用阈值解码数据位,根据编码系统,决定获取的四边形是否有效。

      • 编码系统的目的:

        • 最大化可区分代码的数量
        • 最大化可以检测器校正的比特错误数
        • 最小化误报/标签混淆速率
        • 最小化每个标签的总位(并因此提出标签)
  • 这只是我对这篇论文浅显的理解,欢迎大家在评论区提出疑问,相互交流共同学习!

  • AprilTag 2: Efficient and robust fiducial detection(2016)论文理解

[计算机视觉] AprilTag: A robust and flexible visual fiducial system(2011)论文理解相关推荐

  1. AprilTag: A robust and flexible visual fiducial system论文解读

    AprilTags论文解读 一.Apriltag是改进的ARToolkit. ARTag . 1.1 ARToolkit的劣势: A major disadvantage of this approa ...

  2. AprilTag: A robust and flflexible visual fifiducial system理解

    近期需要对Apriltag方法进行理解,遂阅读了论文,并进行了coding和实验,具体如下:

  3. 论文笔记 DXSLAM: A Robust and Efficient Visual SLAM System with Deep Features

    论文链接:https://arxiv.org/pdf/2008.05416.pdf 代码链接:https://github.com/ivipsourcecode/dxslam 主要内容 本文的主要工作 ...

  4. [计算机视觉] AprilTag 2: Efficient and robust fiducial detection(2016)论文理解

    论文地址 chrome-extension://cdonnmffkdaoajfknoeeecmchibpmkmg/assets/pdf/web/viewer.html?file=https%3A%2F ...

  5. TopoTag:A Robust and Scalable Topological Fiducial Marker System 笔记

    摘要 本文主要是对这一篇论文(TopoTag:A Robust and Scalable Topological Fiducial Marker System)的学习整理.包含的内容分为两个部分,在前 ...

  6. 计算机视觉中的注意力机制(Visual Attention)

    ,欢迎关注公众号:论文收割机(paper_reader) 原文链接:计算机视觉中的注意力机制(Visual Attention) 本文将会介绍计算机视觉中的注意力(visual attention)机 ...

  7. 安装完Visual Team System 2008 Team Explorer出错解决办法

    安装完Visual Team System 2008 Team Explorer 打开一个工作项提示错误如下: --------------------------- Microsoft Visual ...

  8. 2.5D Visual Sound:CVPR2019论文解析

    2.5D Visual Sound:CVPR2019论文解析 论文链接: http://openaccess.thecvf.com/content_CVPR_2019/papers/Gao_2.5D_ ...

  9. MCAN论文进阶——MoVie: Revisting Modulated Convolutions for Visual Counting and Beyond 论文笔记

    MCAN论文进阶--MoVie: Revisting Modulated Convolutions for Visual Counting and Beyond 论文笔记 一.Abstract 二.引 ...

最新文章

  1. 【每日一算法】单词接龙
  2. 静态时序分析的概念以及约束的作用理解
  3. java 字符串拼接优化_JAVA字符串拼接效率
  4. Ajax异步请求-简单模版
  5. [系统集成] RT(Request Tracker)执行自定义脚本及发送微信、短信的实现方法
  6. 微软官方的SqlHelper
  7. ABPZero系列教程之拼多多卖家工具
  8. 新年第一天,3000台Apache服务器宕机
  9. 8位可控加减法电路设计_100以内加减法速算方法,口算速度快一倍
  10. 二进制128位整数运算
  11. 方阵的迹(trace)及其微分(导数)
  12. 【全面解禁!真正的Expression Blend实战开发技巧】第一章 真正的开发中的最佳的做法...
  13. BP神经网络算法推导过程
  14. 基于libexif写入/读取自定义Exif 信息(曝光模式,感光度,GPS等信息)
  15. 利用组策略部署软件——将软件发布给用户
  16. python对excel某一列求和-如何对某一列自动分组,统计求和
  17. nuxt 目录结构及配置文件详解
  18. jMonkeyEngine译文 FlagRush1——通过SimpleGame创建你的第一个应用程序
  19. Latex系列2---段落编写+标题编写+目录生成
  20. 手机中必备的黑科技App,个个好用至极,现在的你一定需要 1

热门文章

  1. 【英语:基础高阶_经典外刊阅读】L3.长句子扒皮—如何快速寻找主干
  2. 热红外探测器的全球与中国市场2022-2028年:技术、参与者、趋势、市场规模及占有率研究报告
  3. 计算机内存与外存有什么特点,为什么计算机要分内存与外存,内存与外存各有什么特点?...
  4. 苹果 M1芯片运行Android模拟器
  5. 输入一行字符,以回车符作为输入结束的标志。统计其中英文字母、数字字符和其他字符的个数
  6. 数据结构与算法 — 约瑟夫问题(Josephu)
  7. 电影网站 php asp,moviewebsite 这是一个电影网站的源码,基于asp技术实现.仅供交流学习 WEB(ASP,PHP,...) 238万源代码下载- www.pudn.com...
  8. xp电脑对ajax的兼容性,xp系统iE11兼容性问题的详细技巧
  9. B. Dubious Cyrpto(思维+枚举)
  10. php字符串函数处理emoji,PHP中处理内容含有emoji表情的几种方式