结构光
   1、结构光的类型就分为很多种,既然是结构光,当然是将光结构化,简单的结构化包括点结构光,线结构光以及简单的面结构光等。复杂一点的结构化就上升到光学图案的编码了。
   2、结构光投射到待测物表面后被待测物的高度调制,被调制的结构光经摄像系统采集,传送至计算机内分析计算后可得出被测物的三维面形数据。其中调制方式可分为时间调制与空间调制两大类。
   2-1、时间调制方法中最常用的是飞行时间法,该方法记录了光脉冲在空间的飞行时间,通过飞行时间解算待测物的面形信息;
   2-2、空间调制方法为结构光场的相位、光强等性质被待测物的高度调制后都会产生变化,根据读取这些性质的变化就可得出待测物的面形信息。

来源:知乎
链接:https://www.zhihu.com/question/54347759/answer/177870402

散斑图
   1、激光散斑:当激光照射在墙壁、纸张、毛玻璃等这些平均起伏大于波长数量级的光学粗糙表面(或透过光学粗糙的透射板)上时,这些表面上无规分布的面元散射的子波相互叠加使反射光场(或透射光场)具有随机的空间光强分布,呈现出颗粒状的结构,这就是激光散斑。
   2、最重要的特点就是,这种散斑具有高度的随机性,而且随着距离的不同会出现不同的图案,也就是说,在同一空间中任何两个地方的散斑图案都不相同。只要在空间中打上这样的结构光然后加以记忆就让整个空间都像是被做了标记,然后把一个物体放入这个空间后只需要从物体的散斑图案变化就可以知道这个物体的具体位置。

来源:CSDN
链接:https://blog.csdn.net/u013360881/article/details/51395427

视差图
   1、视差图同一个场景在两个相机下成像的像素的位置偏差,因为通常下两个双目相机是水平放置的,所以该位置偏差一般体现在水平方向。比如场景中的X点在左相机是x坐标,那么在右相机成像则是(x+d)坐标。d就是视差图中x坐标点的值。视差越大越靠近摄像头。
   2.SAD(“sum of absolute differences")绝对差异和:匹配块的算法,具体为——将右图中选定的模板块与左图选定的块进行对应像素减法,将所有差值取绝对值,然后求和。求出的和就代表两个块的匹配程度,和越小代表匹配程度越高。
   3、视差图和彩色图一一对应,左视图的某个点P(坐标为xp,yp),对应右试图的某个Q(坐标为xq,yq),P点的视差为xp-xq,Q点的视差为xq-xp
   4、对双目成像来说,视差图和深度图在某种程度上是等价的,知道了两个相机的相关参数,是可以将视差图转换为深度图的。

深度图像(depth image)也被称为距离影像(range image)
   1、是指将从图像采集器到场景中各点的距离(深度)作为像素值的图像,它直接反映了景物可见表面的几何形状。其每个像素值代表的是物体表面到摄像头平面的距离(单位为mm)。
   2、深度值最大为4096mm,0值通常表示深度值不能确定,一般应该将0值过滤掉。微软建议在开发中使用1220mm~3810mm范围内的值。
   3、深度图像的获取方法有激光雷达深度成像法、计算机立体视觉成像、坐标测量机法、莫尔条纹法、结构光法等等。
   4、针对深度图像的研究重点主要集中在以下几个方面:深度图像的分割技术、深度图像的边缘检测技术、基于不同视点的多幅深度图像的配准技术、基于深度数据的三维重建技术、基于深度图像的三维目标识别技术、深度数据的多分辨率建模和几何压缩技术等等。
   5、获取深度图像的方法可以分为两类:被动测距传感和主动深度传感。
   5-1、被动测距传感中最常用的方法是双目立体视觉[1,2],该方法通过两个相隔一定距离的摄像机同时获取同一场景的两幅图像,通过立体匹配算法找到两幅图像中对应的像素点,随后根据三角原理计算出时差信息,而视差信息通过转换可用于表征场景中物体的深度信息。基于立体匹配算法,还可通过拍摄同一场景下不同角度的一组图像来获得该场景的深度图像。除此之外,场景深度信息还可以通过对图像的光度特征[3]、明暗特征[4]等特征进行分析间接估算得到。
   5-2、主动测距传感相比较于被动测距传感最明显的特征是:设备本身需要发射能量来完成深度信息的采集。这也就保证了深度图像的获取独立于彩色图像的获取。近年来,主动深度传感在市面上的应用愈加丰富。主动深度传感的方法主要包括了TOF(Time of Flight)、结构光、激光扫描等。
   主动测距传感相比较于被动测距传感最明显的特征是:设备本身需要发射能量来完成深度信息的采集。这也就保证了深度图像的获取独立于彩色图像的获取。近年来,主动深度传感在市面上的应用愈加丰富。主动深度传感的方法主要包括了TOF(Time of Flight)、结构光、激光扫描等。

来源:CSDN
链接:https://blog.csdn.net/nature_XD/article/details/69365812

仿射变换简单理解就是:“线性变换”+“平移”
   1、一个任意的仿射变换都能表示为乘以一个矩阵(线性变换)接着再加上一个向量(平移)。所以,我们能够用仿射变换来实现:旋转(线性变换)、平移(向量加)、缩放(线性变换)。
   2、线性变换从几何来看,具备一些特点:变换前是直线,变换后还是直线;直线比例保持不变;变换前后坐标原点不变。线性变换是通过矩阵乘法来实现的。
   3、仿射变换,区别与线性变换,具备一些特点:变换前是直线,变换后还是直线;直线比例保持不变;少了原点保持不变的特点。平移属于仿射变换的一部分(即向量加减),而不是线性变换;

YUV,分为三个分量,“Y”表示明亮度(Luminance或Luma),也就是灰度值;而“U”和“V” 表示的则是色度(Chrominance或Chroma),作用是描述影像色彩及饱和度,用于指定像素的颜色。
   与RGB类似,YUV也是一种颜色编码方法,主要用于电视系统以及模拟视频领域,它将亮度信息(Y)与色彩信息(UV)分离,没有UV信息一样可以显示完整的图像,只不过是黑白的,这样的设计很好地解决了彩色电视机与黑白电视的兼容问题。并且,YUV不像RGB那样要求三个独立的视频信号同时传输,所以用YUV方式传送占用极少的频宽。
   其中比较常见的YUV420分为两种:YUV420P和YUV420SP。
   我们最常见的YUV420P和YUV420SP都是基于4:2:0采样的,所以如果图片的宽为width,高为heigth,在内存中占的空间为width x height x 3 / 2,其中前width x height的空间存放Y分量,接着width x height / 4存放U分量,最后width x height / 4存放V分量。
   YUV420P又叫plane平面模式,Y , U , V分别在不同平面,也就是有三个平面,它是YUV标准格式4:2:0,主要分为:YU12和YV12。
   YU12格式 在android平台下也叫作I420格式,首先是所有Y值,然后是所有U值,最后是所有V值。YU12:亮度(行×列) + U(行×列/4) + V(行×列/4)
   YV12格式 YV12格式与YU12基本相同,首先是所有Y值,然后是所有V值,最后是所有U值。YV12:亮度Y(行×列) + V(行×列/4) + U(行×列/4);只要注意从适当的位置提取U和V值,YU12和YV12都可以使用相同的算法进行处理。
   YU12: YYYYYYYY UUVV => YUV420P
   YV12: YYYYYYYY VVUU => YUV420P
#############################################################
   我们在android平台下使用相机默认图像格式是NV21属于YUV420SP格式
   YUV420SP格式的图像阵列,首先是所有Y值,然后是UV或者VU交替存储,NV12和NV21属于YUV420SP格式,是一种two-plane模式,即Y和UV分为两个plane,但是UV(CbCr)为交错存储,而不是分为三个平面。
   NV21格式 android手机从摄像头采集的预览数据一般都是NV21,存储顺序是先存Y,再VU交替存储,NV21存储顺序是先存Y值,再VU交替存储:YYYYVUVUVU,以 4 X 4 图片为例子,占用内存为 4 X 4 X 3 / 2 = 24 个字节
   NV12格式 NV12与NV21类似,也属于YUV420SP格式,NV12存储顺序是先存Y值,再UV交替存储:YYYYUVUVUV,以 4 X 4 图片为例子,占用内存为 4 X 4 X 3 / 2 = 24 个字节
   NV12: YYYYYYYY UVUV =>YUV420SP
   NV21: YYYYYYYY VUVU =>YUV420SP
注意:在DVD中,色度信号被存储成Cb和Cr(C代表颜色,b代表蓝色,r代表红色)
#############################################################
Y = (0.257 x R) + (0.504 x G) + (0.098 x B) + 16
Cr = V = (0.439 x R) - (0.368 x G) - (0.071 x B) + 128
Cb = U = -(0.148 x R) - (0.291 x G) + (0.439 x B) + 128
B = 1.164(Y - 16) + 2.018(U - 128)
G = 1.164(Y - 16) - 0.813(V - 128) - 0.391(U - 128)
R = 1.164(Y - 16) + 1.596(V - 128)

来源:CSDN「handy周」
原文链接:https://blog.csdn.net/byhook/article/details/84037338

积分图
   使用积分图是数字图像处理中常用的一种方法,这种算法的主要优点是一旦积分图像首先被计算出来,我们就可以在常量时间内计算图像中任意大小矩形区域的和。这样在图像模糊、边缘提取、对象检测的时候极大降低计算量、提高计算速度。
#############################################################
   从直观来说,一张图像就是一个矩形,这个矩形中每个像素点的积分值,就是以图像左上角像素点为左上角顶点,以该像素点为右下角顶点的矩形中包含的所有元素之和。如下图所示,点(x,y)处的积分值为矩形区域中所有像素之和(包括该点)。

#############################################################
   实际计算积分图的时候,为了提高计算效率,通常不会对每一个像素点都重新计算矩形区域包含的所有元素值之和,而是利用相邻点的积分值实现快速计算,如下图所示,点(x,y)的积分值可以使用点(x-1,y)与点(x,y-1)的积分值之和,然后减去重叠区域,也就是减去点(x-1,y-1)的积分值,最后再加上点(x,y)的像素值得到点(x,y)的积分值。

来源:知乎「sdff」
原文链接:https://zhuanlan.zhihu.com/p/355255078

亚像素
   在相机成像的过程中,获得的图像数据是将图像进行了离散化的处理,由于感光元件本身的能力限制,到成像面上每个像素只代表附近的颜色。例如两个感官原件上的像素之间有4.5um的间距,宏观上它们是连在一起的,微观上它们之间还有无数微小的东西存在,这些存在于两个实际物理像素之间的像素,就被称为“亚像素”。亚像素实际上应该是存在的,只是缺少更小的传感器将其检测出来而已,因此只能在软件上将其近似计算出来。
   亚像素可以表示为如下图所示,每四个红色点围成的矩形区域为实际原件上的像素点,黑色点为亚像素点:

  数字图像通常是被离散化成像素形式;每个像素对应一个整数坐标位置;整数坐标位置对于很多应用然而并不精确,比如跟踪、相机标定、图像配准、图像拼接以及三维重构;为达到有些应用的精确性,需要精确到浮点坐标位置;所以会涉及到亚像素定位问题。亚像素定位就是计算特征所在图像中的真实位置,而真实位置有时候并不在像素所在整数坐标位置上,而是在像素的内部。

2D/3D加速器概念相关推荐

  1. 2D/3D加速器算子

    1.镜像算子 1.1 水平(X轴)镜像 需要将一块内存中的像素,水平镜像写入另一块内存 确定好像素的高度H和宽度W,假设A像素坐标为(src_x0 ,src_y0 ), 对应src内存中地址为: sr ...

  2. Unity安卓游戏开发:打造7款2D 3D游戏 Unity Android Game Development : Build 7 2D 3D Games

    流派:电子学习| MP4 |视频:h264,1280×720 |音频:AAC,44.1 KHz 语言:英语+中英文字幕(根据原英文字幕机译更准确) |大小:15.4 GB |时长:32h 55m Un ...

  3. AP学科介绍|AP艺术与设计(2D/3D艺术与设计、绘画)

    关于AP课程 AP课程让数百万学生在高中的时候就能学习大学程度课程, AP考试在每年五月举行,在AP考试中分数合格的学生通常可以获取大学学分,进入大学后免修对应的基础课程,或两者皆可. AP课程和考试 ...

  4. 分享数百个 HT 工业互联网 2D 3D 可视化应用案例

    过去的 2018 年,我们认为是国内工业互联网可视化的元年,图扑软件作为在工业可视化领域的重度参与者,一线见证了众多 HTML5/Web 化.2D/3D 化的项目在工业界应用落地,我们觉得有必要在此分 ...

  5. 1D/2D/3D卷积详解

    目录 概述 1D卷积 2D卷积 3D卷积 概述 1D/2D/3D卷积计算方式都是一样的,其中2D卷积应用范围最广.与全连接层相比,卷积层的主要优点是参数共享和稀疏连接,这使得卷积操作所需要学习的参数数 ...

  6. 分享数百个 HT 工业互联网 2D 3D 可视化应用案例之 2019 篇

    过去的 2018 年,我们认为是国内工业互联网可视化的元年,图扑软件作为在工业可视化领域的重度参与者,一线见证了众多 HTML5/Web 化.2D/3D 化的项目在工业界应用落地,我们觉得有必要在此分 ...

  7. Unity快速入门之一 3D基础概念、Camera、Canvas RenderMode的几种方式对比

    最近要给公司的小伙伴做Unity入门,针对几个常用的知识进行快速入门介绍. Unity快速入门之一 3D基础概念.Camera.Canvas RenderMode的几种方式对比_翕翕堂 Unity快速 ...

  8. Paper:《How far are we from solving the 2D 3D Face Alignment problem? 》解读与翻译

    Paper:<How far are we from solving the 2D & 3D Face Alignment problem? >解读与翻译 目录 How far a ...

  9. [骨科手术导航]2D/3D医学图像配准研究_罗博博_南方科技大学

    1.绪论 1.1 手术导航 #手术导航是以CT/MRI等医学影像数据为基础,通过虚拟现实技术,定位追踪后显示出手术器械相对病变组织的位置关系,从而实现对手术过程的实时引导. #在外科手术中,临床医生能 ...

最新文章

  1. 大话中文文本分类之TextRCNN
  2. 互联网产品设计的“马化腾法则”
  3. java 消息机制 ActiveMQ入门实例
  4. EHPC通过断点续算和自动伸缩在抢占式实例上实现低成本HPC计算
  5. 多租户数据库设计方法:共享数据库表
  6. 昨日搬至办公室的书籍
  7. 如何通过本地化事件正确实现微服务内部强一致性,事件总线跨微服务间最终一致性...
  8. 学习教材《构建之法》遇到的问题及思路
  9. 【转】TFS上分支和标签的用法
  10. html表白特效源代码_程序员如何在七夕节表白
  11. 蓝桥杯2016年第七届C/C++省赛B组第三题-凑算式
  12. cartographer探秘第一章之安装编译与参数配置
  13. WeChat 隐私政策
  14. Github上托管项目
  15. iOS 常见的URL Schemes
  16. 跑分cpu_跑分完爆骁龙 865?明年这些中端处理器真的要起飞
  17. python取出一组数中的奇偶数
  18. 情感驿站 | 分享一些喜欢的句子
  19. Video.js中m3u8视频清晰度切换
  20. word2vec思考:word2vec为什么不使用非线性激活函数?

热门文章

  1. 基于中国剩余定理的秘密共享方案(miracl库)
  2. 20130723 上海OOW第二日
  3. 企业如何制作自己的公司网站?
  4. Oracle 删除数据后释放数据文件所占磁盘空间(表空间降高水位)
  5. CODJ 1070 秋实大哥打游戏 并查集
  6. PCB线路板塞孔工艺的那些事儿~
  7. 手机相册中的照片如何导入备忘录?
  8. Mac下mysql安装,MySQLclient
  9. Spring框架-IOC
  10. 如何将m4a格式音频转为mp3?