起因

在一个项目的实验过程中,需要对遥控小车的位置进行跟踪和测算。在一穷二白只有一个空房间的情况下,只能自己动手造工具了。本着开放共享的精神,以及为挽救同胞们的头发着想,有必要把原理和过程写下来。所以本文将叙述:如何使用五毛钱成本搭建一个基于视觉的目标测量平台。

目的和环境

人为指定空房间的坐标系,例如左下角是原点,向上是z轴;房间地板上有一个待测坐标的目标;房间地面上放置若干位置已知的定位点;任意放置摄像机,拍摄包含了所有这些元素的图像;编写程序计算目标的位置。

下面的示意图表达了上面这段画的意思。

流程

1.    预备知识

1.1 三种坐标系

相机坐标系(Xc, Yc, Zc):以相机感光原件为坐标系原点,Zc轴与镜头的光轴平行。所有相机坐标系中的坐标点是以摄像机的视角而言的。对于空间中固定的一点,其在相机坐标系中的坐标会随着相机位置的变动而改变。

世界坐标系(Xw, Yw, Zw):人为定义的、实际空间中的坐标系。例如在本例中,人为指定了房间左下角为世界坐标系原点,向上是Z轴。世界坐标系与相机坐标系本没有任何关系,但物理空间中某点的坐标可以在两个坐标系之间转换。转换的方法也很简单,就是旋转变换+平移变换:

世界坐标系和相机坐标系

像平面坐标系(u, v):成像之后照片中的坐标系,二维平面,单位是像素,坐标原点已经不在中心,而是在画面左上角。如图所示:

通过相机的成像模型,可以将相机坐标系中的三维点映射到成像屏幕上的二维点。

1.2 成像模型

初中的物理课上学到过,凸透镜满足下列公式,称为”薄镜公式”
 

$$\frac{1}{f} = \frac{1}{{do}} + \frac{1}{{di}}$$

在相机镜头上,do>>di≈f
可以简化得到针孔相机成像模型:
 
这里把成像面移到了右边,但不妨碍数学上的正确。根据相似三角形原理,有:
 

因此,相机坐标系中的点[X,Y,Z]转换到二维成像面上的[x,y],可以通过下列公式实现:

这里,[X,Y,Z]和[x,y]的量纲仍旧一样,是物理长度;[x,y]的坐标原点还是成像平面与光轴的交点。

但是,在图像处理时,处理对象是像素,而且图像左上角才是原点,如下图。

所以从相机坐标系到图像坐标的变换如下。

其中3*4矩阵的第4列将原点移到了左上角;fx的量纲不再是长度,而是像素/长度,实际上,fx=f/px, px是x方向上像素的宽度。
此外,这个3*3矩阵也叫做相机的内参矩阵,因为传感器和相机镜头的参数决定了这个矩阵。

再把世界坐标系也引入进来,最终的成像模型表达式如下(!划重点!)

其中A由相机本身决定,称之为相机矩阵或内参(intrinsic parameters)矩阵,R为旋转矩阵,T为平移向量,称之为外部参数。

2. 相机标定

相机标定的目的是为了求得内参矩阵A和镜头畸变系数dist (distortion coefficients).
内参矩阵A的含义在前面已经叙述过了,畸变系数dist是为了矫正镜头对成像造成的畸变。畸变包括径向畸变(radial distortion)和切向畸变(tangential distortion)。
最典型的径向畸变是广角镜头的成像效果;而切向畸变来源于镜头和感光器件组装时的不平行,在五块钱的相机模组上尤其严重。

下图展示了径向畸变和切向畸变的效果。

径向畸变

切向畸变

径向畸变和切向畸变可以通过数学模型尽可能地复原,但也仅是近似复原而已,再也回不到最初的模样了。畸变矫正的模型如下:
 
其中k1-k6用于矫正径向畸变,称为径向畸变系数。p1、p2用于矫正切向畸变系数。
根据矫正时所用阶数的不同,opencv中使用的畸变参数格式如下,
 
参数的数量可以是4、5、8.

相机标定的本质是:对已知角点三维位置关系的标志板成像,使图像点的预定义位置(根据三维点的投影计算得到)和实际位置(图像中的位置)之间的距离达到最小。每个点在标定过程中都会产生这个距离,它们的累加和就是重投影误差. 以重投影误差为优化目标,求解内存矩阵A和畸变参数dist. 求解过程有点复杂,但前人的成果已经变成函数可以用了。张氏标定算法(Zhang. A Flexible New Technique for Camera Calibration. IEEE Transactions on Pattern Analysis and Machine Intelligence, 22(11):1330-1334, 2000)就是做这件事的。

标志点一般使用棋盘图案
当然也可以用圆盘
有闲情逸志自己在地上画几个点也可以,
理论上只要能得到一组[ 物理世界三维坐标 - 图像二维像素坐标]的集合就可以
所以你可以在这里找到各种可用于标定的pattern.

本文中使用棋盘标志板,手机摄像头拍摄。现在手机的镜头都有自动对焦功能,不同的焦点下内参是不一样的,因此需要用手动模式固定对焦点到无穷远。推荐一款软件cinema FV-5 可以在摄像时锁定对焦点。

然后从不同角度,不同距离,不同位置拍摄二十张左右的棋盘图片

Opencv中相机标定的核心函数是calibrateCamera()。我们准备使用棋盘标志板,用python语言,函数的输出输出如下:

cv2.calibrateCamera(objectPoints, imagePoints, imageSize[, cameraMatrix[, distCoeffs[, rvecs[, tvecs[, flags[, criteria]]]]]]) → retval, cameraMatrix, distCoeffs, rvecs, tvecs

调用calibrateCamera()前需要先准备好feed它的参数,主要是标志板上的三维坐标点集合objectPoints和对应的二维像素坐标imagePoints.

objectPoints是已知的,棋盘上的角点位置是四四方方的排布,直接构造就好了,

objp = np.zeros((cornerX*cornerY,3), np.float32)
objp[:,:2] = np.mgrid[0:cornerX,0:cornerY].T.reshape(-1,2) * squareSize

求解内存A和畸变系数时,棋盘格子的长度单位其实不需要知道,只需要知道相对位置即可,因为长度比例并不影响这两个参数的求解。棋盘格子的长度最终会影响外参R和T. 但每个此从棋盘图像求解到的外参并不一样,我们暂且也不需要这些外参。所以上面的 squareSize其实可以直接设成1,opencv的例子中直接就没有乘以 squareSize这个过程,如果不知道标定的原理,看了就容易让人产生困惑。

通过检测图片中的角点确定对应的图像二维坐标点,这里使用findChessboardCorners()函数.

运行程序,标定结束之后在终端显示内参矩阵和畸变系数:

$ python calibrate.py ('mtx: \n', array([[  1.58908007e+03,   0.00000000e+00,   9.63684080e+02],[  0.00000000e+00,   1.59532586e+03,   5.61602291e+02],[  0.00000000e+00,   0.00000000e+00,   1.00000000e+00]]))
('dist: \n', array([[  4.17032261e-01,  -1.97266626e+00,   2.26847015e-03,1.37087506e-03,   3.12510368e+00]]))
calibration finished, result saved as .npz file

完整的程序如下。

#!/usr/bin/ python
# -*- coding: utf-8 -*-
#從文件夾讀取棋盤圖片,校準相機,將參數保存到文件.
#2019年7月17日
#guofeng, mailto:gf@gfshen.cn
#---------------------------------------
import numpy as np
import cv2
import glob#ref: https://opencv-python-tutroals.readthedocs.io/en/latest/py_tutorials/py_calib3d/py_calibration/py_calibration.htmldef  calibrate(cornerX=8,cornerY=6, squareSize=24.5,images=glob.glob('*.jpg')  ):# termination criteriacriteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 30, 0.001)# prepare object points, like (0,0,0), (1,0,0), (2,0,0) ....,(6,5,0)objp = np.zeros((cornerX*cornerY,3), np.float32)objp[:,:2] = np.mgrid[0:cornerX,0:cornerY].T.reshape(-1,2) * squareSize  #如果squareSize设错,对mtx和dist的估计没有影响,但对rvecs和tvecs有影响# Arrays to store object points and image points from all the images.objpoints = [] # 3d point in real world spaceimgpoints = [] # 2d points in image plane.for fname in images:img = cv2.imread(fname)gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)# Find the chess board cornersret, corners = cv2.findChessboardCorners(gray, (cornerX,cornerY),None)# If found, add object points, image points (after refining them)if ret == True:objpoints.append(objp)corners2 = cv2.cornerSubPix(gray,corners,(11,11),(-1,-1),criteria)imgpoints.append(corners2)# Draw and display the cornersimg = cv2.drawChessboardCorners(img, (cornerX,cornerY), corners2,ret)cv2.imshow('img',img)cv2.waitKey(500)cv2.destroyAllWindows()#开始标定ret, mtx, dist, rvecs, tvecs = cv2.calibrateCamera(objpoints, imgpoints, gray.shape[::-1],None,None)if ret:print('mtx: \n',mtx)print('dist: \n', dist)#print('rvecs: \n', rvecs)#print('tvecs: \n',tvecs)np.savez('calibrateData.npz', mtx=mtx, dist=dist)return ret, mtx, dist, rvecs, tvecsdef undistortion(img, mtx, dist):h, w = img.shape[:2]newcameramtx, roi = cv2.getOptimalNewCameraMatrix(mtx, dist, (w, h), 1, (w, h))dst = cv2.undistort(img, mtx, dist, None, newcameramtx)# crop the imagex, y, w, h = roiif roi != (0, 0, 0, 0):dst = dst[y:y + h, x:x + w]return dstif __name__ == '__main__':image=glob.glob('./chessBoardNote3/*.bmp')if not image:raise RuntimeError('Cant find image,exting')#用于存储内参矩阵和畸变参数mtx = []dist = []try:npzfile = np.load('calibrate.npz')mtx = npzfile['mtx']dist = npzfile['dist']except IOError:ret, mtx, dist, rvecs, tvecs = calibrate( cornerX=8,cornerY=6, squareSize=24.5,images= image  )print('calibration finished, result saved as .npz file ')

至此,得到了相机内参。接下来将使用已知参数的相机,保持固定焦点,拍摄包含目标的图像,然后测算目标位置。

基于单目视觉的平面目标定位和坐标测量 (上) - 坐标系和成像模型相关推荐

  1. 基于单目视觉的平面目标定位和坐标测量 (下) - 相机姿态估计和目标测量

    上回说到,我们回顾了机器视觉的基础知识,然后一顿操作之后得到了相机内参A和畸变系数dist. 现在我们开始定位目标的坐标. 这个过程包括几个子部分: 1.    标记检测 2.    指定世界坐标系, ...

  2. android gps 差分定位,基于Android的高精度GPS定位与土地测量应用设计

    摘要: 随着移动平台技术的飞速发展,Android作为一款新兴的嵌入式操作系统,基于Android系统的移动终端应用设计成为当今应用开发的一个主流.而GPS(Global Positioning Sy ...

  3. 目标定位算法(二)之基于测距的定位算法

    文章目录 基于测距的定位算法 1.最小二乘原理 2.最小二乘定位算法 3.基于RSSI测距的定位算法 4.基于TOA/TDOA的目标定位算法 1)基于TOA测距 2)基于TDOA测距 基于测距的定位算 ...

  4. 单目视觉的运动目标跟踪定位

    [转] http://www.leiphone.com/news/201704/z87wjT8j9s94tMnG.html 市场上空间定位的技术方案分为单目.双目以及激光雷达三大阵营,其中激光雷达由于 ...

  5. 无人机光电吊舱目标定位

    @无人机光电吊舱目标定位TOC 参考论文<一种基于KL-AEPF的无人机侦察移动目标定位算法>了解目标定位需要用到的坐标系 这篇论文这部分讲的不错! /*<一种基于KL-AEPF的无 ...

  6. 【新无人机数据集】从 行人重识别 到 无人机目标定位

    论文题目:University-1652: A Multi-view Multi-source Benchmark for Drone-based Geo-localization 论文地址:http ...

  7. 基于视觉Transformer的目标检测

    基于视觉Transformer的目标检测 无卷积骨干网络:金字塔Transformer,提升目标检测/分割等任务精度 https://github.com/whai362/PVT 例如,在参数数量相当 ...

  8. 趋高智能机器视觉图像目标尺寸检测尺寸测量的应用方案

    趋高智能机器视觉图像目标尺寸检测尺寸测量的应用方案. 趋高智能机器视觉系统具有测量功能,能够自动测量产品的外观尺寸,比如外形轮廓.孔径.高度.面积等尺寸的测量.尺寸测量无论是在产品的生产过程中,还是产 ...

  9. 目标定位算法(三)之基于角度的定位算法

    文章目录 基于角度测量的定位算法 1.双战角度定位 2.三角测量法定位 基于角度测量的定位算法 又叫纯方位目标定位,它的测量信息是目标与观测站之间的角度,包括方向角和俯仰角等. 1.双战角度定位 例: ...

  10. 基于单目视觉的同时定位与地图构建方法综述

    摘要: 增强现实是一种在现实场景中无缝地融入虚拟物体或信息的技术, 能够比传统的文字.图像和视频等方式 更高效.直观地呈现信息,有着非常广泛的应用. 同时定位与地图构建作为增强现实的关键基础技术, 可 ...

最新文章

  1. VirtualBox上装CentOS5.8网络不通问题
  2. unity热更新json_Unity3D热更新 CSHotFix入门教程之HelloWorld
  3. python/Django(增、删、改、查)操作
  4. TI Davinci DM6441嵌入式Linux移植攻略——UBL移植篇
  5. Azure WAF 导致网站无法登录 AAD 的解决办法
  6. scrcpy投屏_scrcpy 使用教程:将安卓设备投屏到 PC 端
  7. 使用 classList API
  8. 数据挖掘实验——认识数据与进行数据预处理
  9. macos系统安装homebrew包管理工具
  10. 广西事业单位考试 计算机基础知识,2018年广西壮族自治区事业单位考试《公共基础知识》1000题【必考题库】.pdf...
  11. 一台电脑登陆两个微信账号
  12. 【七】【vlc-android】vlc的decoder控制层传输数据与ffmpeg音频解码模块decoder层进行解码的数据交互流程源码分析
  13. 测试管理办公室TMO职责
  14. 动态内存的申请和非动态内存的申请_英国:国内双非学生,非相关背景,能申请英国卡迪夫大学计算机硕士课程吗?申请难度大吗?附案例分享...
  15. 宝塔Linux面板——用正确的入口登录面板
  16. k8s重新生成token
  17. Java内容整理回顾——第一回 小卷入坑记
  18. 参加饭局,遇到这三种小人,别主动深交,以免败坏声誉
  19. DirectSound 笔记
  20. 机器学习的划分:监督学习、非监督学习、强化学习、进化学习

热门文章

  1. 网络文章(摘录)_顺序
  2. 计算机主要主机的组成部分包括什么作用,电脑的组成及其作用各是什么
  3. imageJ如何在视频每一帧中添加text
  4. HTML中的input type=reset标签失效(不起作用)的可能原因
  5. 阿里巴巴内部面试资料
  6. hive hql 交差并集 练习
  7. 内容下沉新时代:在一二线做品质,去三四线接地气
  8. python身份证号处理代码_Python实现身份证号码解析
  9. 使用F021_API_F2837xD_FPU32.lib 库函数遇到的问题 warning #10068-D: no matching section
  10. ISE如何生成msc文件,并写入flash中