IplImage详解

IplImage

这是OpenCV中提供的图像结构体。它的结构如下:

typedef struct _IplImage
{
int nSize;                     /* IplImage大小 */
int ID;                        /* 版本 (=0)*/
int nChannels;               /* 大多数OPENCV函数支持1,2,3 或 4 个通道 */
int alphaChannel;          /* 被OpenCV忽略 */
int depth;                   /* 像素的位深度: IPL_DEPTH_8U, IPL_DEPTH_8S, IPL_DEPTH_16U,IPL_DEPTH_16S, IPL_DEPTH_32S, IPL_DEPTH_32F and IPL_DEPTH_64F 可支持 */
char colorModel[4];            /* 被OpenCV忽略 */
char channelSeq[4];            /* 同上 */
int dataOrder;                 /* 0 - 交叉存取颜色通道, 1 - 分开的颜色通道.cvCreateImage只能创建交叉存取图像 */
int origin;                    /* 0 - 顶—左结构,1 - 底—左结构 (Windows bitmaps 风格) */
int align;                     /* 图像行排列 (4 or 8). OpenCV 忽略它,使用 widthStep 代替 */
int width;                     /* 图像宽像素数 */
int height;                    /* 图像高像素数*/
struct _IplROI *roi;           /* 图像感兴趣区域. 当该值非空只对该区域进行处理 */
struct _IplImage *maskROI;     /* 在 OpenCV中必须置NULL */
void *imageId;                 /* 同上*/
struct _IplTileInfo *tileInfo; /*同上*/
int imageSize;                 /* 图像数据大小(在交叉存取格式下imageSize=image->height*image->widthStep),单位字节*/
char *imageData;               /* 指向排列的图像数据 */
int widthStep;                 /* 排列的图像行大小,以字节为单位 */
int BorderMode[4];             /* 边际结束模式, 被OpenCV忽略 */
int BorderConst[4];            /* 同上 */
char *imageDataOrigin;         /* 指针指向一个不同的图像数据结构(不是必须排列的),是为了纠正图像内存分配准备的 */
}
IplImage;

重要结构元素说明:

(1) depth和nChannels

depth代表颜色深度,使用的是以下定义的宏,nChannels是通道数,为1,2,3或4。

depth的宏定义:

IPL_DEPTH_8U,无符号8bit整数(8u)

IPL_DEPTH_8S,有符号8bit整数(8s)

IPL_DEPTH_16S,有符号16bit整数(16s)

IPL_DEPTH_32S,有符号32bit整数(32s)

IPL_DEPTH_32F,32bit浮点数,单精度(32f)

IPL_DEPTH_64F,64bit浮点数,双精度(64f)

(2) origin和dataOrder

origin变量可以有两个取值:IPL_ORIGIN_TL或者IPL_ORIGIN_BL,分别代表图像坐标系原点在左上角或是左下角。

相应的,在计算机视觉领域,一个重要的错误来源就是原点位置的定义不统一。例如,图像的来源不同,操作系统不同,视频解码codec不同,存储方式不同等等,都可以造成原点位置的变化。例如,你可能认为你正在从图像上面的脸部附近取样,但实际上你却在图像下方的裙子附近取样。最初时,就应该检查一下你的系统中图像的原点位置,这可以通过在图像上方画个形状等方式实现。

dataOrder的取值可以是IPL_DATA_ORDER_PIXEL或者IPL_DATA_ORDER_PLANE,这个成员变量定义了多通道图像数据存储时颜色数据的排列方式,如果是IPL_DATA_ORDER_PIXEL,通道颜色数据排列将会是BGRBGR...的交错排列,如果是IPL_DATA_ORDER_PLANE,则每个通道的颜色值在一起,有几个通道,就有几个“颜色平面”。大多数情况下,通道颜色数据的排列是交错的。

(3) widthStep和imageData

widthStep与CvMat中的step类似,是以字节数计算的图像的宽度。

imageData则保存了指向图像数据区首地址的指针。使用这两个成员可以访问图像的像素点。

以下是对图像数据具体元素的操作:

// 假设有 8-bit 1-通道的图像 I (IplImage* img):
((uchar*)(img->imageData + img->widthStep*y))[x];//访问I(x,y)处的像素点// 假设有 8-bit 3-通道的图像 I (IplImage* img):
((uchar*)(img->imageData + img->widthStep*y))[x*3];//I(x,y) blue
((uchar*)(img->imageData + img->widthStep*y))[x*3+1];//I(x,y) green
((uchar*)(img->imageData + img->widthStep*y))[x*3+2];//I(x,y) red// 例如,给点 (100,100) 的亮度增加 30 ,那么可以这样做:
CvPoint pt = {100,100};
((uchar*)(img->imageData + img->widthStep*pt.y))[pt.x*3] += 30;
((uchar*)(img->imageData + img->widthStep*pt.y))[pt.x*3+1] += 30;
((uchar*)(img->imageData + img->widthStep*pt.y))[pt.x*3+2] += 30;
// 或者更高效地:
CvPoint pt = {100,100};
uchar* temp_ptr = &((uchar*)(img->imageData + img->widthStep*pt.y))[pt.x*3];
temp_ptr[0] += 30;
temp_ptr[1] += 30;
temp_ptr[2] += 30;
// 假设有 32-bit 浮点数, 1-通道 图像 I (IplImage* img):
((float*)(img->imageData + img->widthStep*y))[x];//I(x,y)// 现在,一般的情况下,假设有 N-通道,类型为 T 的图像:
((T*)(img->imageData + img->widthStep*y))[x*N + c]; //I(x,y)
// 你可以使用宏 CV_IMAGE_ELEM( image_header, elemtype, y, x_Nc )
CV_IMAGE_ELEM( img, T, y, x*N + c );//I(x,y)c
// 也有针对各种图像(包括 4 通道图像)和矩阵的函数(cvGet2D, cvSet2D), 但是它们非常慢。
//实际应用中,也可以如下使用:
IplImage  image;
uchar * imagedata;
imagedata=(uchar*)image->imageData;
imagedata[i*image->widthStep+j*image->nChannels+n]=****;//I(i,j)的第n个通道

以下是针对整个图像数据的操作

(1)iplImage = cvCreateImageHeader(cvSize(width,heigth),IPL_DEPTH_8U,1);cvSetData(iplImage,pGrayBuffer,width*1); //第3个参数是行字节数cvReleaseImageheader(&iplImage);free(pGrayBuffer); //pGrayBuffer是程序里用来放灰度数据的空间,由calloc分配(2)iplImage = cvCreateImage(cvSize(width,heigth),IPL_DEPTH_8U,1);iplImage->imageData=pGrayBuffer;iplImage->imageDataOrigin=pGrayBuffer;cvReleaseImageheader(&iplImage);free(pGrayBuffer);
(3) iplImage = cvCreateImage(cvSize(width,heigth),IPL_DEPTH_8U,1);memcpy(iplImage->imageData,pGrayBuffer,iplImage->imageSize);cvReleaseImage(&iplImage);free(pGrayBuffer); 

结论:  这3种方式都正确,但推荐用第(1)种。

       如果imageData指向的空间是由cvCreateImage初始化的,那么用cvReleaseImage来释放;

       如果imageData指向的空间是后来用户指定的,那么用vReleaseImageheader(&iplImage);释放,并由用户自行释放分配的空间。

          其实(1)cvSetData所做的事情和(2)中两句指针赋值类似。

       

       如果分配和释放没搭配好,比如自行分配空间搭配上cvReleaseImage(&iplImage);就会出现“OpenCV ERROR: Unknown error code -49 (Deallocation error)”这类错误。另外,补充一下,“利用cvCreateImage新建一个IplImage,之后一个个的对结构体的成员进行赋值”是非常多余的,cvCreateImage就已经根据参数中的宽度,高度,通道数,颜色深度等信息对结构体的各个成员初始化了,不需要再手动的去赋值。这里要提一下char *imageDataOrigin; 这个变量的说明是指针指向一个不同的图像数据结构(不是必须排列的),是为了纠正图像内存分配准备的,实际上初始化后的imageDataOrigin和imageData指向的是同一个地址。既然初始化成这样,我也没去改变它,没有产生什么影响。

注:opencv论坛上sunlighta大侠的解释是:“预留数据接口吧!上面有这么一句话:IplImage结构来自于 Intel Image Processing Library(是其本身所具有的)。OpenCV 只支持其中的一个子集。”
注:linux下的内存对齐默认是4字节,可以通过以下语句进行修改:
#progma pack(n)

(4) roi

     roi(region of interest 感兴趣的区域),这个参数是IplROI结构体类型的变量。它允许对图像的某一小部分进行操作,而不是对整个图像进行运算。在OpenCV中,所有的对图像操作的函数都支持roi,如果你想打开roi,可以使用函数cvSetImageROI(),并给函数传递一个矩形子窗口。而cvResetImageROI()是用于关闭roi的。在程序中一旦使用了roi做完相应的运算,就一定要用cvResetImageROI()来关闭roi,否则,其他操作执行时还会使用roi的定义。

     IplROI结构体包含了xOffset,yOffset,height,width,coi成员变量,其中xOffset,yOffset是x,y坐标,coi代表channel of interest(感兴趣的通道)。有时候,OpenCV图像函数不是作用于整个图像,而是作用于图像的某一个部分。这是,我们就可以使用roi成员变量了。如果IplImage变量中设置了roi,则OpenCV函数就会使用该roi变量。如果coi被设置成非零值,则对该图像的操作就只作用于被coi指定的通道上了。不幸的是,许多OpenCV函数忽略了coi的值。

void cvSetImageROI(IplImage* image,CvRect rect);
void cvResetImageROI(IplImage* image);

附录

以下是lxfei73朋友对IplI0mage使用的经验。
###############################################################################
我最初使用的方法是利用cvCreateImage新建一个IplImage,之后一个个的对结构体的成员进行赋值。其他的成员的赋值都没有问题,而对于char *imageData; 的赋值却遇到了问题。
我把自己在程序里把从摄像头读取的UYVY数据转换为R=G=B=Y的3通道RGB24的数据,并保存在自己calloc的空间中,最后把这个空间的指针赋给imageData这个变量。在程序运行的时候问题来了,出现“alignment trap......bus error”的错误,内存对齐出问题了。
之前遇到过自己定义的结构体,由于内存对齐的问题而出现编译器在结构体中插入空字段而使sizeof()的值变化的问题。于是,第一反应去查看IplImage这个结构体是否是对齐的,结果发现这个结构体的每个变量都是4字节的,非常完美的对齐。
显然,不是结构体的问题,于是我想到给imageData这个指针赋值的问题,因为我是把自己calloc的一个空间的指针赋给它的,如果calloc的这个起始地址不是4字节的整数倍,这样imageData就会出现内存对齐的问题了。
于是,把赋值操作删除,改为将calloc后空间中的数据memcpy到imageData经过cvCreateImage初始化后指向的空间。结果证明,这里就是问题所在,修改之后一切正常了。
###################################################################################

文章来源:

(1)IplImage的用法 作者 lxfei73  http://blog.csdn.net/lxfei73/article/details/6406670

(2)由IplImage引发的一场关于图像存贮结构的学习 
     作者 钰 http://blog.csdn.net/ofalling/article/details/8750414#

IplImage详解相关推荐

  1. CvMat、Mat、IplImage之间的转换详解及实例

    IplImage: 在OpenCV中IplImage是表示一个图像的结构体,也是从OpenCV1.0到目前最为重要的一个结构: 在之前的图像表示用IplImage,而且之前的OpenCV是用C语言编写 ...

  2. OpenCV Mat类详解和用法(官网原文)

    参考文章:OpenCV Mat类详解和用法 我马克一下,日后更 官网原文链接:https://docs.opencv.org/3.2.0/d6/d6d/tutorial_mat_the_basic_i ...

  3. OpenCv学习笔记(二)--Mat矩阵(图像容器)的创建及CV_8UC1,CV_8UC2等参数详解

    (一)Mat矩阵(图像容器)创建时CV_8UC1,CV_8UC2等参数详解 1--Mat不但是一个非常有用的图像容器类,同时也是一个通用的矩阵类 2--创建一个Mat对象的方法很多,我们现在先看一下M ...

  4. JAVA使用摄像头录制_JavaCV开发详解之1:调用本机摄像头视频(建议使用javaCV最新版本)...

    引入依赖 org.bytedeco javacv 1.5.3 org.bytedeco javacv-platform 1.5.3 代码实现 package com.java.mmzsblog; im ...

  5. OpenCV Mat类详解和用法

    OpenCV Mat类详解和用法 我们有多种方法可以获得从现实世界的数字图像:数码相机.扫描仪.计算机体层摄影或磁共振成像就是其中的几种.在每种情况下我们(人类)看到了什么是图像.但是,转换图像到我们 ...

  6. 高帧率扑克牌识别技术详解一(可用于车牌识别,字符识别,人脸检测,验证码识别等等成熟领域)

    分享一下我老师大神的人工智能教程!零基础,通俗易懂!http://blog.csdn.net/jiangjunshow 也欢迎大家转载本篇文章.分享知识,造福人民,实现我们中华民族伟大复兴! 高帧率扑 ...

  7. OpenCV的Rect()函数、Rectangle()函数、matchTemplate()参数详解

    OpenCV的函数 Rect()函数 cvRectangle与cv::rectangle matchTemplate() 归一化函数normalize() Rect()函数 基本概念: Rect(in ...

  8. OpenCv--Mat矩阵(图像容器)的创建及CV_8UC1,CV_8UC2等参数详解

    (一)Mat矩阵(图像容器)创建时CV_8UC1,CV_8UC2等参数详解 1--Mat不但是一个非常有用的图像容器类,同时也是一个通用的矩阵类 2--创建一个Mat对象的方法很多,我们现在先看一下M ...

  9. 25.消除不相关的细节/裂缝桥接(形态学 --膨胀与腐蚀详解 )--- OpenCV从零开始到图像(人脸 + 物体)识别系列

    本文作者:小嗷 微信公众号:aoxiaoji 吹比QQ群:736854977 简书链接:https://www.jianshu.com/u/45da1fbce7d0 本文你会找到以下问题的答案: 形态 ...

  10. Sift特征提取详解

    计算机视觉中的特征点提取算法比较多,但SIFT除了计算比较耗时以外,其他方面的优点让其成为特征点提取算法中的一颗璀璨的明珠.SIFT算法的介绍网上有很多比较好的博客和文章,我在学习这个算法的过程中也参 ...

最新文章

  1. (C++)1025 PAT Ranking
  2. 250g硬盘linux分区,linux分区格式化命令使用方法
  3. [END_OBJECT] but found [FIELD_NAME]')
  4. Linux操作系统下 NAND FLASH驱动程序框架
  5. .NET Remoting构建分布式数据库查询
  6. Struts框架原理分析之我见
  7. 特征工程(part4)--特征缩放:tf-idf
  8. 转:Linux下高并发socket最大连接数所受的各种限制
  9. lmbs PHP,PHP 清空 MySql 指定数据表中的所有数据
  10. matplotlib markers的类型
  11. React Router路由详解
  12. 机器学习相关——协同过滤
  13. 如何从文件名字符串中获取文件扩展名_Linux操作系统:文件系统的功能和命名...
  14. spark 三种部署模式的区别对比
  15. SAP、ERP、OA名词解释,SAP与ERP区别; ERP与OA区别
  16. 魔域充值卡表cq_card里chk_sum参数的算法
  17. python可视化——matplotlib画图颜色控制
  18. lorawan 科普文
  19. BFS(宽度优先搜索、广度优先搜索)
  20. 【Swing】JTextArea文本域组件

热门文章

  1. HDR图像渲染滤镜软件:Topaz Adjust AI for mac
  2. 人民币大写金额转换为数字
  3. python发邮件smtplib+mail
  4. Ubuntu16.04 LTS无法开启无线网开关的解决方法(联想Y7000)
  5. 贴吧android客户端,百度贴吧推出Android平台手机客户端
  6. 高数笔记(十四):多元复合函数的求导法则,隐函数的偏导数,多元微分在几何上的应用
  7. jabber服务器_最近JavaScript Jabber播客-Microsoft(而非Microsoft)和Web
  8. 如何听节拍器_学琴必备的节拍器,你用对了么?
  9. linux的百度网盘客户端
  10. boobooke大牛小牛们的视频教程