python图像降采样_OpenCV:十一、图像上采样和降采样
前言
目标
本章中,将学习:
图像金字塔概念
采样API
代码演示
图像金字塔概念
图像金字塔是图像中对尺度表达的一种,最主要用于图像的分割,是一种以多分辨率来解释图像的有效但概念简单的结构。
图像金字塔最初用于机器视觉和图像压缩,一幅图像的金字塔是一系列以金字塔形状排列的分辨率逐步降低,且来源于同一张原始图的图像集合。其通过梯次向下采样获得,直到达到某个中值条件才停止采样。
金字塔的底部是待处理图像的高分辨率表示,而顶部是低分辨率的近似。
我们将一层一层的图像比喻成金字塔:层级越高,则图像越小,分辨率越低。
金字塔图像.png0
一般情况下有两种类型的图像金字塔常常出现在文献和实际运用中。他们分别是:
高斯金字塔(Gaussianpyramid):从底向上,逐层降采样得到,降采样之后图像大小是原图像的MxN的M/2 x N/2,就是对原图像删除偶数行与列,即得到降采样之后上一层的图片;
拉普拉斯金字塔(Laplacianpyramid): 用来从金字塔低层图像重建上层未采样图像,在数字图像处理中也即是预测残差,可以对图像进行最大程度的还原,配合高斯金字塔一起使用。
两者的简要区别:高斯金字塔用来向下降采样图像,而拉普拉斯金字塔则用来从金字塔底层图像中向上采样重建一个图像。
要从金字塔第i层生成第i+1层(我们表示第i+1层为G_i+1),我们先要用高斯核对G_1进行卷积,然后删除所有偶数行和偶数列。当然的是,新得到图像面积会变为源图像的四分之一。按上述过程对输入图像G_0执行操作就可产生出整个金字塔。
当图像向金字塔的上层移动时,尺寸和分辨率就降低。OpenCV中,从金字塔中上一级图像生成下一级图像的可以用PryDown。而通过PryUp将现有的图像在每个维度都放大两遍。
高斯不同(Difference of Gaussion-DOG):就是把同一张图像在不同的参数下做高斯模糊之后的结果相减,得到的输出图像。高斯不同是图像的内在特征,在灰度图像增强,角点检测中经常用到。
图像层级.png
相关API
上采样: void pyrUp( InputArray src, OutputArray dst,const Size& dstsize = Size(), int borderType = BORDER_DEFAULT );
函数作用:先对图像进行升采样(将图像尺寸行和列方向增大一倍),然后再进行高斯平滑;
函数说明:倒数第二个参数,在默认的情况下,这个尺寸大小是按照 Size(src.cols2, (src.rows2) 来计算的。如果你自己要指定大小,那么一定要满足下面的条件:|dstsize.width - src.cols * 2| ≤ (dstsize.width mod 2); //如果width是偶数,那么必须dstsize.width是src.cols的2倍;|dstsize.height - src.rows * 2| ≤ (dstsize.height mod 2);然后这个函数运行的过程就是先将图像的尺寸行和列方向都放大一倍,然后进行高斯平滑,不过此时高斯平滑的kernel是上面pyrDown()中的kernel乘上4,而不是完全相同。( 其实也很容易理解,行和列方向各放大一倍的结果就是图像的面积放大四倍,所以这里给之前的kernel乘以4)。
上采样: void pyrUp( InputArray src, OutputArray dst,const Size& dstsize = Size(), int borderType = BORDER_DEFAULT );
函数作用:先对图像进行高斯平滑,然后再进行降采样(将图像尺寸行和列方向缩减一半);
函数说明:倒数第二个参数,这个参数指的是降采样之后的目标图像的大小,我们可以看出它是有默认值的,如果我们调用函数的时候不指定第三个参数,那么这个值是按照 Size((src.cols+1)/2, (src.rows+1)/2) 计算的。而且不管你自己如何指定这个参数,一定必须保证满足以下关系式:
|dstsize.width * 2 - src.cols| ≤ 2;
|dstsize.height * 2 - src.rows| ≤ 2;
也就是说降采样的意思其实是把图像的尺寸缩减一半,行和列同时缩减一半。所以你指定的大小,无非就是多一行少一列的区别而已。在大多数情况下使用默认值就可了,因为这个函数不是缩减图像至任意尺寸,就只是缩减一半,所以没必要搞得那么复杂。
这个缩减的过程是这样的,隔行隔列删去图像中的对应行和列!由此我们也可以看出,这样缩减会带来的影响就是:原图中那些精细的细节边缘等地方,会因此变得锯齿状,产生失真,因此为了缩小之后图像看起来自然,必须进行平滑,这也就是这个算法为什么在降采样之前先对图像进行了高斯模糊的原因。
代码演示
#include
#include
#include
using namespace cv;
using namespace std;
int main(int argc, char* argv[])
{
// 1、加载图像,可以是BGR或者灰度图像
Mat src = imread("D:/浏览器下载/谷歌下载/lena512color.tiff");
if (!src.data) {
printf("could not load image...\n");
return -1;
}
char input_win[] = "input image";
namedWindow(input_win, WINDOW_AUTOSIZE);
imshow(input_win, src);
Mat dst;
char output_win[] = "pyrUp image";
namedWindow(output_win, WINDOW_AUTOSIZE);
// 上采样
pyrUp(src, dst, Size(src.cols * 2, src.rows * 2));
imshow(output_win, dst);
// 降采样
Mat downImg;
pyrDown(src, downImg, Size(src.cols / 2, src.rows / 2));
imshow("pyrDown image", downImg);
// DOG
Mat gray_src, g1, g2,dogimage;
cvtColor(src, gray_src, COLOR_BGR2GRAY); // 转换图像色彩空间
GaussianBlur(gray_src, g1, Size(5, 5), 0, 0); // 高斯模糊
GaussianBlur(g1, g2, Size(5, 5), 0, 0);
subtract(g1, g2, dogimage); // 图像相减值非常低,图像轮廓如果不做处理,不清晰
normalize(dogimage, dogimage, 255, 0, NORM_MINMAX); // 归一化显示,图像映射到0-255范围
imshow("DOG Image", dogimage);
waitKey(0);
return 0;
}
···
![采样效果.png](https://upload-images.jianshu.io/upload_images/16412133-5893aab32d284185.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
![高斯不同效果.png](https://upload-images.jianshu.io/upload_images/16412133-f225f565bc58f4dd.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
python图像降采样_OpenCV:十一、图像上采样和降采样相关推荐
- 上采样和下采样_OpenCV学习笔记(一)之图像金字塔-上采样与降采样与DOG
一. 图像金字塔 一个图像金字塔式一系列的图像组成,最底下的图形尺寸最大,最上方的图像尺寸最小. 高斯金字塔是从底向上,逐层降采样得到的. 高斯金字塔的生成过程分为两步: 对当前层进行高斯模糊. 删除 ...
- 卷积神经网络 池化层上采样(upsampling、interpolating)、下采样(subsampled、downsampled)是什么?(上采样为放大图像或图像插值、下采样为缩小图像)
缩小图像:或称为下采样(subsampled)或降采样(downsampled) 主要目的有两个:1.使得图像符合显示区域的大小:2.生成对应图像的缩略图. 放大图像:或称为上采样(upsamplin ...
- 上采样(放大图像)和下采样(缩小图像)(最邻近插值和双线性插值的理解和实现)
上采样和下采样 什么是上采样和下采样? • 缩小图像(或称为下采样(subsampled)或降采样(downsampled))的主要目的有 两个:1.使得图像符合显示区域的大小:2.生成对应图像的缩略 ...
- opencv:用最邻近插值和双线性插值法实现上采样(放大图像)与下采样(缩小图像)
上采样与下采样 概念: 上采样: 放大图像(或称为上采样(upsampling)或图像插值(interpolating))的主要目的 是放大原图像,从而可以显示在更高分辨率的显示设备上. 下采样: 缩 ...
- Python案例:通过方向键移动屏幕上的图像
Python案例:通过方向键移动屏幕上的图像 1.安装PyGame (1)下载PyGame http://www.lfd.uci.edu/~gohlke/pythonlibs/#pygame
- Python与机器视觉(x)图像差分-图像相减
本系列博客主要分享Python在机器视觉/计算机视觉下的编程应用 cv2包是著名的视觉库OpenCV的Python实现 在求峰值信噪比PSNR时,我们需要求取目标图像和实际图像之间的误差. err = ...
- Python Imaging Library: ImageOps Module(图像运算模块)
Python Imaging Library: ImageOps Module(图像运算模块) (版本1.1.3) ImageOps模块包含许多"现成的"图像处理操作.这个模块是实 ...
- python计算机视觉学习第三章——图像到图像的映射
目录 引言 一. 单应性变换 1.1 直接线性变换算法 1.2 仿射变换 二. 图像扭曲 2.1 图像中的图像 2.2 分段仿射扭曲 2.2 图像配准 三.创建全景图 3.1 RANSAC(随机一致性 ...
- Python计算机视觉编程第三章——图像到图像的映射
Python计算机视觉编程 图像到图像的映射 (一)单应性变换 1.1 直接线性变换算法 1.2 仿射变换 (二)图像扭曲 2.1 图像中的图像 2.2 图像配准 (三)创建全景图 3.1 RANSA ...
最新文章
- 20190226-利用序列化完成小型记账程序
- 通过btrace排查线上频繁Full GC的case
- 内核中修改和保存defconfig的方法
- c语言开发游戏趋势,都9012年了,为何我还坚持用C语言开发游戏
- 中文论文万能句型_SCI 论文写作万能句型(每天一点小进步哦)
- Real提示“作为受限用户,您无足够的windows操作权限”的解决办法
- Flutter根据偏移量转换角度 Offset 的使用实例
- 《Genesis-3D游戏引擎系列教程-进阶篇》10:动画融合
- 我与希赛PMP的不解之缘
- vue项目中使用阿里巴巴矢量图标库iconfont
- linux硬盘坏了无法查看分区,Linux 磁盘坏道检测和修复 查看硬盘坏道代码
- win10微信打电话对方听不到你的声音,你能听到对方声音
- C# 添加水印图片、文字、缩略图处理
- Y2K Bug and Bill Door
- r中gglot怎么组合多张图_R语言之可视化①⑧子图组合patchwork包
- 剑指offer每日六题---------day five
- 阿里云数据库 mysql RDS 连接失败 HikariPool-1 - Exception during pool initialization.
- 前端工程师高手说说CSS学习中的瓶颈
- UOS如何格式化U盘
- VisionMobile 2012年移动开发者经济报告(九) 四 应用市场销售(下)