• 作者简介: 古鉴,于2015年加入暴风魔镜,负责 AR 类产品及交互技术的研发工作。
    方维,主要从事计算机视觉和 AR 相关的跟踪定位研究。
  • 本文为作者投稿,版权归原作者所有,非经作者同意,请勿转载。欢迎技术投稿、约稿、给文章纠错,请发送邮件至mobile@csdn.net。

最近增强现实越来越被大家熟悉起来。最近看到一个案例(http://www.pps.tv/w_19rtditek5.html),见图一。 现代汽车发布电子用车手册,其亮点是融入了 AR 技术。车主只需拿起手机或平板对准车子,该 AR 系统即能自动识别这是车子的哪一部分,并给出相关的信息。目前,该用车手册涵盖了空气滤清器、智能巡航控制、警示标志、机油、制动液等方面的信息,同时还包含基于增强现实技术的视频、指南。

图一 现代汽车运用增强现实技术

很多人问我这是用到了什么样的 AR 技术,是不是 SLAM?没错,这里面的确用到了 SLAM 相关技术。更确切地说,应该是 SLAM 框架中的一个重要技术环节:基于模型的追踪技术(Model Based Tracking)。

今天,就让我们来讨论一下这个基于模型的追踪技术技术,我先从整体介绍一下增强现实中的追踪技术。增强现实技术的核心组成部分主要是(图二):显示技术、输入交互技术和识别追踪技术。

图二 增强现实的核心技术

显示部分主要是光学成像相关技术,该部分与硬件相关的比较多,这里就不做展开介绍了。输入交互的技术主要涉及语音交互、手势交互等。这个我们会在下一期重点讨论。我认为有了交互技术及空间感知的追踪技术,即可实现了 AR 的基本功能。在这里,我们重点介绍追踪技术。

追踪技术是计算机科学中一个广阔而重要的领域,它在教育、娱乐、工业和制造领域具有广泛的应用。伴随着成像设备和硬件计算能力的发展,当前基于计算机视觉的物体跟踪技术取得了重大的发展。

追踪技术主要分为:

  1. 光学追踪;
  2. 内部传感器追踪;
  3. 超声波追踪;
  4. 磁力追踪;
  5. 机械装置追踪。

光学追踪是相对来说成本最低,比较精确的解决方案。它的难点主要在于视觉算法的门槛较高。AR 中的光学追踪分为几种(见图三),在 VR 中 OutsideIn 的方式用的比较多,比如 Oculus、HTC Vive、PS VR用的都是 Outside 进行的位置追踪。但是在AR中,基本都是 InsideOut,比如说 Hololens。当然最近 Oculus 的一体机用的也是 InsideOut 的追踪方式。

InsideOut 比 OutsideIn 更加方便,成本更加低。但目前,OutsideIn 的方式更为精确一些。如在一些工业场景,多使用反光材质的标示点或特殊材质进行 Outsidein 光学追踪。

标识追踪现在用的比较多,比如说大家看到的识字卡片、绘本等都是所谓的标识追踪,其最早的代表就是 ARToolkit 的。但该基于 Marker 的技术需要预先在 AR 场景中粘贴一定的标识,在用户体验和适应性方面具有较大的局限性。为此,基于无标识的 AR 技术是目前发展的方向。其中,无标识别追踪是实现该技术核心问题之一,像是 SLAM 等都是属于这个类别。我们这次主要介绍红色部分的 Model-Based Tracking。

图三 光学追踪分类

Model-Based Tracking 的主要技术框架如下图四所示,下面将该过程分为建模(Models)、视觉信息处理(Visual processing)、跟踪(Tracking)三个方面,并依次对其进行展开。

图四 基于模型跟踪的三个主要任务:Models,Visual processing,Tracking

1. 模型建立(Models)

模型(Models)的建立主要从目标、传感器和环境三个方面展开。首先对于跟踪目标,需要该目标一些先验信息(prior knowledge),如被跟踪物体的形状、外观、姿态等特性。其次是需要从传感器的角度去考虑,比如如果使用未标定的单目相机,其获取的信息多以 pixel 为单位,若使用立体相机或深度相机,其构建的尺寸信息是 Metric 的,因此不同传感器的选择对被跟踪物体的表征形式会有不同影响。最后是从环境的角度,在基于视觉的跟踪过程中,环境对跟踪的准确性具有很关键的作用,比如在室内光照、环境相对稳定的情况下,重建所得模型就具有更加稳定,能很大程度提高基于模型跟踪的准确性。

当前,在模型建立(models)阶段,主要可分为 Online 和 Offline 两种模型构建技术。Online 在线建模方式:以 SLAM 为代表,其在追踪的同时建立模型,其中追踪和建模是两个相互依赖的过程,其彼此间的误差会相互传递并累加,为保证较好追踪精度,一般需要借助 Bundle Adjustment 等优化方法调整。但目前,该优化方法计算量较大。目前在 PC 端有较好的实现,在移动端尚存在计算能力相对不足的问题。Offline 离线建模方式:将建模和跟踪分开,规避了 SLAM 过程中建模的不确定性,同时克服了建模所需大量运算量的问题,因此该方法能提高跟踪的精度和效率。

目前 Offline 离线建模主要是有两种情况:

(1)已知目标物体的 CAD 形状,如模型在设计制造过程中已有的 CAD 先验知识,在工业应用及企业级别的应用场合,因此多以本情况为主。
(2)通过传感器(如结构光扫描、RGBD、ToF等)逆向获取目标物体的模型信息,然后以此模型作为一个先验知识。在实际的生活应用中,个人参与者不大可能获取已有物体的 CAD 形状,因此只能借助简单的传感器离线获取模型,因此这种离线获取模型的方式更加适用于消费者。

图五 不同的物体跟踪形式(当前主要以Shape和Appearance为主)

2. 视觉信息处理 (Visual processing)

视觉信息处理主要是提取和关联传感器所获取的目标物体信息,以更新整个跟踪系统的状态。在实际的应用中,我们需要根据被跟踪目标的特性,选择稳定的跟踪线索(如颜色、边界、运动规律、背景信息等等)。

具体在实际应用过程中,是根据构建的模型信息,确定被预处理的对象。如在工业的 AR 等跟踪过程中,多以 CAD 的形状和拓扑信息为处理对象,该视觉信息处理过程即为对形状和拓扑信息的采样提取,和数据关联等。在 2D/3D 领域,多以其各自对应的纹理特征和形状特征为研究对象,整个视觉信息的处理过程是以提取、优化获取构建模型的稳定特征为目标。

目前,该方法可进一步细分为:基于颜色的信息处理;基于关键特征的信息处理;基于轮廓的信息处理和基于模板的信息处理四部分。

3. 跟踪 (Tracking)

当被传感器获取的数据经预处理输入后,即可实现物体的定位跟踪,该过程具体可以细分为检测和跟踪两个阶段。在检测阶段,需要以被跟踪物体的先验信息作为初始值,利用觉信息处理技术获取的模型信息,与输入的数据进行匹配,确定其在空间的姿态,实现对目标的跟踪。

目前针对移动端 6DoF(Degree of Freedom)的跟踪,主流是采用视觉和 IMU 进行融合,实现更稳定的跟踪(如 Tango)。

以上就是我们极少的 model-Based tracking. 以后我们会逐一介绍增强现实技术是如何实现的。

探讨增强现实(AR)基于模型的追踪技术相关推荐

  1. 【数字孪生】数字孪生模型在产品构型管理中应用探讨;不可忽视的轻量级三维可视化技术...

    针对MBD技术的深层次应用,论述了数字线和数字孪生定义的概念和应用,指出数字线和数字孪生模型技术实施的重点和核心问题.指明全三维产品研制模式下对产品构型管理的新需求,探讨了基于数字孪生模型的产品构型管 ...

  2. 什么是基于模型的测试?

    基于模型的测试属于软件测试领域的一种测试方法.MBT步骤如下: 常规测试一般是由人来设计几个特定的测试场景,然后断言测试结果.测试用例固定.缺少不确定性.基于模型的测试(Model-based Tes ...

  3. [论文]基于模型的细长体欠驱动水下机器人输出反馈控制:理论与实验

    [论文]基于模型的细长体欠驱动水下机器人输出反馈控制:理论与实验 摘要 本文介绍了一种新型细长体水下机器人输出反馈控制器的设计和实验结果.控制器是使用基于模型的设计技术得到的.采用了两个独立的控制设备 ...

  4. 【源码】基于模型的阶梯式车架设计仿真

    该代码对M3类客车底盘框架结构进行了建模. The code, models a structure of the Chassis-frame of M3-Category of Bus. 通过对实际 ...

  5. 基于模型的测试用例设计(1)

    介绍 测试设计是测试过程中最重要的部分之一.一个好的测试用例不仅要为被测系统( SUT )提供一些输入,还要验证系统是否如预期进行.也就是说,它有助于确认利益相关者要求得以实现.但测试设计可以做的远不 ...

  6. 基于模型的测试的测试设计

    为什么80%的码农都做不了架构师?>>>    TeemuKanstrén是一名资深科学家,目前在芬兰VTT技术研究中心工作,他还是多伦多大学的一名客座博士后.他的工作涉及:以改进行 ...

  7. 关于增强现实(AR技术)的开源库推荐

      关于增强现实(AR技术)的开源库推荐 kezunhai@gmail.com http://blog.csdn.net/kezunhai 1.ARToolKit, 知名度很高的AR库了,可以商用,免 ...

  8. 基于MSFM算法与最速下降法的射线追踪技术

    基于MSFM算法与最速下降法的射线追踪技术 文章目录 基于MSFM算法与最速下降法的射线追踪技术 1.射线追踪效果 2.技术原理 3.代码 上面的代码是是主程序代码,包含的两个子函数在网上可以找到,代 ...

  9. 基于移动设备与CNN的眼动追踪技术简介

    眼动追踪是一项科学应用技术,用户无需与交互设备物理接触即可发送信息与接收反馈.从原理上看,眼动追踪主要是研究眼球运动信息的获取.建模和模拟,用途颇广.而获取眼球运动信息的设备除了红外设备之外,还可以是 ...

最新文章

  1. 对javscript中Object.defineProperty的理解
  2. Matlab与线性代数 -- 矩阵的左除
  3. linux3.0 nand分区,OK6410(256MRAM2Gnandflash) Linux3.0.1内核移植
  4. 怎样在python代码中输入π_鼠标自动点击、键盘自动输入?几行Python代码搞定
  5. SQL批量更新DateTime中的年、月、日
  6. 悲痛!高校一研究生在校内被撞身亡,肇事者为该校博导,警方已介入
  7. 【视频特辑】提效神器,如何用Quick BI高效配置员工的用数权限
  8. Java题-直接赋值与重新创建内存
  9. 如何避免重要需求遗漏?
  10. 【Negix】Nginx 面试 一些题目
  11. android实用测试方法之Monkey与MonkeyRunner
  12. Dubbo服务服务暴露之ProxyFactory Invoker
  13. Win10网络图标消失,网络图标变成灰色,打开网络设置闪退等问题解决
  14. 使用VC 编程改变字体 注意点--需要设置GB2312—CHARSET
  15. WindowsServer2012搭建FTP服务器站点
  16. w3wp ash oracle,Oracle session简介
  17. SecureCRT9.0.1、SecureFX9.0.1,windows与mac版本下载
  18. PYthon-PIckle泡菜库
  19. python在每个字符后加上逗号_Python将逗号添加到数字字符串中
  20. 六年级下册第二单元计算机,六年级下册语文第二单元作文(精选10篇)

热门文章

  1. HOWTO:如何修改InstallShield的运行环境
  2. 用findstr查找特定文件里面的字符串
  3. mysql 并行复制搭建_基于GTID的主从实践系列之④并行复制搭建及测试
  4. 《FreeFlow: Software-based Virtual RDMA Networking for Containerized Clouds》
  5. leetcode算法题--最长公共前缀
  6. linux I/O--I/O多路复用--select总结(三)
  7. python number函数_Python3 数据类型-Number
  8. 炉石传说服务器维护有补偿吗,炉石传说官网维护补偿什么时候到 未到原因说明...
  9. 我在51CTO微职位学软考——网络工程师
  10. 【关于封装的那些事】 缺失封装 【关于封装的那些事】 泄露的封装 【关于封装的那些事】 不充分的封装 【图解数据结构】二叉查找树 【图解数据结构】 二叉树遍历...