3D-camera结构光原理

目前主流的深度探测技术是结构光,TOF,和双目。具体的百度就有很详细的信息。

而结构光也有双目结构光和散斑结构光等,没错,Iphone X 的3D深度相机就用 散斑结构光。

我用结构光模块做过实验,主要考虑有效工作距离,精度和视场角是否满足需求。

本文对结构光(Structured Light)技术做一个比较全面的简介。

结构光三维成像的硬件主要由相机和投射器组成,结构光就是通过投射器投射到被测物体表面的主动结构信息,如激光条纹、格雷码、正弦条纹等;然后,通过单个或多个相机拍摄被测表面即得结构光图像;最后,基于三角测量原理经过图像三维解析计算从而实现三维重建。

利用红外相机像素点信息求解被测物体深度信息需要经过:机构光解码、像素、空间坐标转换;为了满足获取深度信息的实时性,结构光模块内部一般会有一枚专用的处理芯片,用于计算并输出实时信息。

3D结构光目前的使用场景为:

第一,物体信息分割与识别,3D人脸识别,用于安全验证、金融支付等场景;

第二,体感手势识别,为智能终端提供新的交互方式;

第三,三维场景重建,利用深度相机生成的深度信息(点云数据),结合RGB彩色图像信息,可完成对三维场景的还原,可用于测距,虚拟装修等场景。

基于结构光的三维成像,实际上是三维参数的测量与重现,主要是区别于纯粹的像双目立体视觉之类的被动三维测量技术,因而被称为主动三维测量。因为他需要主动去投射结构光到被测物体上,通过结构光的变形(或者飞行时间等)来确定被测物的尺寸参数,因此才叫做主动三维测量,嗯,相当主动。

首先,结构光的类型就分为很多种,既然是结构光,当然是将光结构化,简单的结构化包括点结构光,线结构光以及简单的面结构光等。复杂一点的结构化就上升到光学图案的编码了。结构光投射到待测物表面后被待测物的高度调制,被调制的结构光经摄像系统采集,传送至计算机内分析计算后可得出被测物的三维面形数据。其中调制方式可分为时间调制与空间调制两大类。时间调制方法中最常用的是飞行时间法,该方法记录了光脉冲在空间的飞行时间,通过飞行时间解算待测物的面形信息;空间调制方法为结构光场的相位、光强等性质被待测物的高度调制后都会产生变化,根据读取这些性质的变化就可得出待测物的面形信息。

下面以一种应用广泛的光栅投影技术(条纹投影技术)为例来阐述其具体原理。条纹投影技术实际上属于广义上的面结构光。其主要原理如下图所示, 即通过计算机编程产生正弦条纹,将该正弦条纹通过投影设备投影至被测物,利用CCD相机拍摄条纹受物体调制的弯曲程度,解调该弯曲条纹得到相位,再将相位转化为全场的高度。当然其中至关重要的一点就是系统的标定,包括系统几何参数的标定和CCD相机以及投影设备的内部参数标定,否则很可能产生误差或者误差耦合。因为系统外部参数不标定则不可能由相位计算出正确的高度信息。

总体而言,结构光主要可以分为两类

线扫描结构光;

面阵结构光。

一般说结构光的时候都指代第二类,这里也主要关注面阵结构光。

  1. 线扫描结构光

线扫描结构光较之面阵结构光较为简单,精度也比较高,在工业中广泛用于物体体积测量、三维成像等领域。

1.1 数学基础

先来看一个简单的二维下的情况:

通过上图可以看到线扫描结构光装置的一个基本结构。主动光源L缓慢扫过待测物体,在此过程中,相机记录对应的扫描过程,最后,依据相机和光源在该过程中的相对位姿和相机内参等参数,就可以重建出待测物体的三维结构。

由上图可知:

可得

其中, α 为投影装置的朝向。 β 则需要通过对应像素的像素坐标 μ和焦距f来确定。最终可知P点的三维坐标为:

将之推广至三维空间中

:由小孔成像模型有

由三角测量原理又有

两式联立则有

最后可得

可以看到,三维空间中的情形和之前的二维空间类似,作为俯仰角的 γ并没有出现在公式中。

1.2 应用

如上图,相机与投影器等相对位姿都经过了精确的校正,并且选取了测量台上的一角作为原点建立物方坐标系。因此,激光投影器所投射的线激光在物方坐标系中可以通过一个平面方程来描述:

而相机光心的位姿通过几何校正也已知,可以通过找到线激光在图像中的对应像素重建出光心与像素的射线,射线和激光平面的交点即为待求的三维空间点。由小孔成像模型有

代入平面方程中,可得

  1. 面阵结构光

面阵结构光大致可以分为两类:随机结构光和编码结构光。随机结构光较为简单,也更加常用。通过投影器向被测空间中投射亮度不均和随机分布的点状结构光,通过双目相机成像,所得的双目影像经过极线校正后再进行双目稠密匹配,即可重建出对应的深度图。如下图为某种面阵的红外结构光。

随机结构光这里就不再说了,因为和普通双目算法是很相似的。一些额外的考虑就是是否给相机加装滤光片、光斑的密度要到什么程度等硬件和光学的问题了。这里主要讨论编码结构光。编码结构光可以分为两类:

时序编码;

空间编码。

2.1 时序编码

如上图,时序编码结构光即为在一定时间范围内,通过投影器向被测空间投射一系列明暗不同的结构光,每次投影都通过相机进行成像。假设共有n张影像,并设被阴影覆盖的部分编码值为1,未被覆盖的部分编码值为0。此时,每个像素都对应唯一一个长度为n的二进制编码,双目影像搜索匹配像素的问题就变成了查找具有相同编码值的像素。如果双目图像已经进行了极线校正,那么所投影的结构光只需要在x方向上不具有重复性即可。

如上图中,红框内的像素的编码为0110,转化为十进制则为5。此时,只需要在右图相同行上检索编码值为5的像素即可。上图编码方式称为二进制码(binary code),每段区域不断的进行二分下去直至投影的编码宽度等于相机的像素宽度即可。对于宽度为1024的图像,最少需要10张影像来进行编码。

Binary Code 的一种改进为Gray Code. Gray Code比Binary Code具有更好的鲁棒性,它使得相邻两个像素相差1bit。Gray Code的详细介绍和其与Binary Code之间的转换可以参考wikipedia。

注意观察即可看到gray code和binary code在前几行像素上的不同

转换算法:

自然,除了使用二进制的0-1编码之外,还可以使用更多颜色层级的编码。假设使用了M种不同的灰度层级进行编码,则拍摄N张影像可以得到包含 个条带的影响。如下图中M = 3, N = 3时图中有27条条带。

由以上的介绍也可以得出时序编码结构光的优缺点:优点:

· 高精度;

缺点:

· 只适用于静态场景;

· 需要拍摄大量影像。

2.2 空间编码

为满足动态场景的需要,可以采用空间编码结构光。前面谈到了随机结构光,就是不带编码信息,投影随机纹理,而这里讨论的空间编码结构光特指向被测空间中投影经过数学编码的、一定范围内的光斑不具备重复性的结构光。由此,某个点的编码值可以通过其临域获得。其中,包含一个完整的空间编码的像素数量(窗口大小)就决定了重建的精度。

2.2.1 德布鲁因序列 (De Bruijn) 序列

德布鲁因序列(维基百科)B(k, n) 表示用k个符号(如二进制,k = 2)来表示长度为 的循环编码,n为一个编码值的长度。举例:最简单的,k = 2时,采用二进制符号(0, 1),编码值的长度n = 2,可以得到一个长度为 的循环序列:[0, 0,
1, 1]。此时,我们得到4个长度为2的不同的编码:[0, 0], [0, 1], [1, 1], [1, 0].因此,某种结构光就可以按照该德布鲁因序列进行编码。而获得的结构光影像中,以上4个像素的编码为[0, 0, 1, 1],通过一个大小为2的滑动窗口(假定一个结构光光斑或光束的宽度是一个像素)即可获取每个像素的编码值。同样地,如果是经过极线校正的双目图像,只需要搜索对应的行即可,此时只要求编码在x轴上不具备重复性。此时的结构光就是竖直条带状的。当然,为了提高编码效率,也可以使用灰度图、彩色图像等比0-1编码具有更多可能编码值的投影方式。例如,对于RGB影像,采用二进制编码(即某种颜色只有 有、无 两种状态),则共有 种颜色组合,去除(0, 0,
0),还剩下7种颜色。因此k = 7, n = 3,这样就可以获得一个长度为343的条带序列。对于这个序列,唯一的约束为:相邻的条带不能为同样的颜色。否则对于解码算法来说很容易造成误差。下图展示了只使用5种颜色(k = 5, n = 3)的结构光序列:

2.2.2 二维空间编码

德布鲁因序列是一种一维编码,可以将之扩展到二维空间中,使得对于一个x * y大小的二维空间,其中一个w * h大小的子窗口所包含的编码值在这整个二维编码序列中只出现一次。

如上面中的4 * 6的M-arrays序列中,每个2 * 2大小的窗口所包含的编码值都是唯一的。同样也可以利用RGB信息来进行二维编码,有相关算法来产生一些伪随机二维编码。如在下图中,左边展示了一个6 * 6大小的二维矩阵,子窗口的大小为3 * 3。算法首先在左上角的3 * 3子窗口中随机填入各种颜色;然后一个3 * 1大小的滑动窗口移动到右端第一个空白处,并随机填入3中颜色;在填入生成的随机颜色前,算法会先验证子窗口的编码的唯一性能不能得到保证,若不能,则会重新生成3中随机颜色;如此循环,只是在竖直方向上滑动窗口的大小变为1 * 3,直至将整个6 * 6矩阵填满。右图则是该算法产生的某种伪随机二维编码的示例。

通过以上对空间编码的讨论,也可以看出空间编码结构光的一些优缺点:优点:

· 无需多张照片,只需要一对影像即可进行三维重建。可以满足实时处理,用在动态环境中。

缺点

· 易受噪声干扰:由于反光、照明等原因可能导致成像时部分区域等编码信息缺失;

· 对于空间中的遮挡比较敏感;

· 相较于时序编码结构光精度较低。

以上是对各种常用的结构光技术的一些介绍。其实,三维重建中最常用的还是随机面阵结构光。通过向空间中投影这样的随机结构光,再结合双目稠密重建,可以获得比单纯使用RGB影像进行三维重建更加可靠和精确的结果。最后,向对结构光和三维重建感兴趣的同学推荐一个项目:build your own 3D scanner。和名字一样,网站上提供了自己使用触手可及和低成本的设备来DIY一个3D扫描仪所需的一切,包括教程、ppt、代码、数据和其他人的作品展示,感兴趣的同学欢迎动手尝试。

3D-camera结构光原理相关推荐

  1. 奥比中光Gemini 3D双目结构光深度相机在Android平台上深度数据噪点非常多的问题

    相机:Gemini 3D双目结构光深度相机 环境:Android7.1 软件:SDK中的java demo下的depthforopenni2 问题: 在Android样例depthforopenni2 ...

  2. Gemini 3D双目结构光深度相机在Android平台上深度数据噪点非常多的问题

    相机:Gemini 3D双目结构光深度相机 环境:Android7.1 软件:SDK中的java demo下的depthforopenni2 问题: 在Android样例depthforopenni2 ...

  3. 3D结构光原理及应用浅析

    3D结构光,是近些年立体视觉图像处理应用比较热的方向,区别于双目立体视觉以及TOF(飞行时间),3D结构光深度相机模块 通常由一枚红外投影仪,红外相机以及一块专门用于计算深度的处理器组成,如下图所示: ...

  4. 顺藤摸瓜之3D结构光原理

    1概述: 如何描述二维相平面中的一个点? 该二维相面,即 三维空间 的一个点 两个船桨位于 水面(二维平面)的点,通过支架(光心),两桨(光机相机)相交于一三维空间点的一点. 水面表示相机面和光机面: ...

  5. 揭秘三维视觉之结构光原理

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 知乎作者David LEE 本文的目的就是对结构光(Structu ...

  6. 基于3D的结构光的应用

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达本文转自 | 新机器视觉  End  下载1:OpenCV-Cont ...

  7. 3D成像方法汇总(原理解析):双目视觉、激光三角、结构光、ToF、光场、全息...

    作者丨路人甲ing..@CSDN 来源丨https://blog.csdn.net/tyfwin/article/details/89110067 编辑丨3D视觉工坊 3D成像方法汇总介绍: 这里要介 ...

  8. 3D成像方法 汇总(原理解析)— 双目视觉、激光三角、结构光、ToF、光场、全息...

    3D成像方法汇总介绍: 这里要介绍的是真正的3D成像,得到物体三维的图形,是立体的图像.而不是利用人眼视觉差异的特点,错误感知到的假三维信息.  原理上分类:主要常用有: 1.双目立体视觉法(Ster ...

  9. 3D成像汇总(原理解析)--- 双目视觉、激光三角、结构光、ToF、光场、全息

    本文转载,方便查阅.原文链接:https://blog.csdn.net/tyfwin/article/details/89110067 目录 简介 1.双目立体视觉法: 2.激光三角法 3.结构光3 ...

最新文章

  1. ML基石_14_Regularization
  2. django修改服务器名称,django部署和服务器配置教程
  3. hibernate基本映射文件
  4. Qt官方开发环境生成的exe发布方式--使用windeployqt
  5. 受教黑金文档,再度优化兼容irq uart代码
  6. 职业生涯中的愚蠢想法
  7. Android之DiskLruCache(缓存工具)
  8. ServerSocketChannel API用法
  9. linux查看帮助信息,命令帮助信息的获取
  10. POI生成Word多级标题格式
  11. C语言期末考试复习题(有答案)
  12. OpenWrt 18.06.1的ss-redir, 以及在乐视超4 X40上看Youtube
  13. 中国计算机的科技成果,中国9大科技成就,每一个都是实力派
  14. 帕卡贝尔的D大调卡农之由来
  15. 记一次简单学习MarkDown语法
  16. vue照片查看器插件v-viewer
  17. 回溯法--深度优先搜索
  18. Mask Scoring R-CNN——源码运行记录
  19. mysql 查看slave状态_解读show slave status 命令判断MySQL复制同步状态
  20. 【darknet源码解析-24】shortcut_layer.h 和 shortcut_layer.c 解析

热门文章

  1. 2022-2028年中国马铃薯市场研究及前瞻分析报告
  2. pip install 豆瓣源、清华源、阿里源、中国科技大学源
  3. 2022-2028年中国再生天然橡胶行业市场调查分析及未来前景分析报告
  4. TF-IDF 原理及sklearn中的tf-idf实例分析
  5. 关于C语言中的数组指针、指针数组以及二级指针
  6. 离线安装Visual Studio Code插件
  7. Python 读取文本时的 read/readline/readlines
  8. TENSORFLOW变量作用域(VARIABLE SCOPE)
  9. LeetCode简单题之最少操作使数组递增
  10. NVIDIA® TensorRT™ supports different data formats