本文是OpenCV  2 Computer Vision Application Programming Cookbook读书笔记的第一篇。在笔记中将以Python语言改写每章的代码。

PythonOpenCV的配置这里就不介绍了。

注意,现在opencv for python就是通过NumPy进行绑定的。所以在使用时必须掌握一些NumPy的相关知识!

图像就是一个矩阵,在OpenCV for Python中,图像就是NumPy中的数组!

如果读取图像首先要导入OpenCV包,方法为:

[python] view plaincopy
  1. import cv2

读取并显示图像

在Python中不需要声明变量,所以也就不需要C++中的cv::Mat xxxxx了。只需这样:

[python] view plaincopy
  1. img = cv2.imread("D:\cat.jpg")

OpenCV目前支持读取bmp、jpg、png、tiff等常用格式。更详细的请参考OpenCV的参考文档。

接着创建一个窗口

[python] view plaincopy
  1. cv2.namedWindow("Image")

然后在窗口中显示图像

[python] view plaincopy
  1. cv2.imshow("Image", img)

最后还要添上一句:

[python] view plaincopy
  1. cv2.waitKey (0)

如果不添最后一句,在IDLE中执行窗口直接无响应。在命令行中执行的话,则是一闪而过。

完整的程序为:

[python] view plaincopy
  1. import cv2
  2. img = cv2.imread("D:\\cat.jpg")
  3. cv2.namedWindow("Image")
  4. cv2.imshow("Image", img)
  5. cv2.waitKey (0)
  6. cv2.destroyAllWindows()

最后释放窗口是个好习惯!

创建/复制图像

新的OpenCV的接口中没有CreateImage接口。即没有cv2.CreateImage这样的函数。如果要创建图像,需要使用numpy的函数(现在使用OpenCV-Python绑定,numpy是必装的)。如下:

[python] view plaincopy
  1. emptyImage = np.zeros(img.shape, np.uint8)

在新的OpenCV-Python绑定中,图像使用NumPy数组的属性来表示图像的尺寸和通道信息。如果输出img.shape,将得到(500, 375, 3),这里是以OpenCV自带的cat.jpg为示例。最后的3表示这是一个RGB图像。

也可以复制原有的图像来获得一副新图像。

[python] view plaincopy
  1. emptyImage2 = img.copy();

如果不怕麻烦,还可以用cvtColor获得原图像的副本。

[python] view plaincopy
  1. emptyImage3=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
  2. #emptyImage3[...]=0

后面的emptyImage3[...]=0是将其转成空白的黑色图像。

保存图像

保存图像很简单,直接用cv2.imwrite即可。

cv2.imwrite("D:\\cat2.jpg", img)

第一个参数是保存的路径及文件名,第二个是图像矩阵。其中,imwrite()有个可选的第三个参数,如下:

cv2.imwrite("D:\\cat2.jpg", img,[int(cv2.IMWRITE_JPEG_QUALITY), 5])

第三个参数针对特定的格式: 对于JPEG,其表示的是图像的质量,用0-100的整数表示,默认为95。 注意,cv2.IMWRITE_JPEG_QUALITY类型为Long,必须转换成int。下面是以不同质量存储的两幅图:

对于PNG,第三个参数表示的是压缩级别。cv2.IMWRITE_PNG_COMPRESSION,从0到9,压缩级别越高,图像尺寸越小。默认级别为3:

[python] view plaincopy
  1. cv2.imwrite("./cat.png", img, [int(cv2.IMWRITE_PNG_COMPRESSION), 0])
  2. cv2.imwrite("./cat2.png", img, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])

保存的图像尺寸如下:

还有一种支持的图像,一般不常用。

完整的代码为:

[python] view plaincopy
  1. import cv2
  2. import numpy as np
  3. img = cv2.imread("./cat.jpg")
  4. emptyImage = np.zeros(img.shape, np.uint8)
  5. emptyImage2 = img.copy()
  6. emptyImage3=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
  7. #emptyImage3[...]=0
  8. cv2.imshow("EmptyImage", emptyImage)
  9. cv2.imshow("Image", img)
  10. cv2.imshow("EmptyImage2", emptyImage2)
  11. cv2.imshow("EmptyImage3", emptyImage3)
  12. cv2.imwrite("./cat2.jpg", img, [int(cv2.IMWRITE_JPEG_QUALITY), 5])
  13. cv2.imwrite("./cat3.jpg", img, [int(cv2.IMWRITE_JPEG_QUALITY), 100])
  14. cv2.imwrite("./cat.png", img, [int(cv2.IMWRITE_PNG_COMPRESSION), 0])
  15. cv2.imwrite("./cat2.png", img, [int(cv2.IMWRITE_PNG_COMPRESSION), 9])
  16. cv2.waitKey (0)
  17. cv2.destroyAllWindows()

参考资料:
《OpenCV References Manuel》

图像是人们喜闻乐见的一种信息形式,“百闻不如一见”,有时一张图能胜千言万语。图像处理是利用计算机将数值化的图像进行一定(线性或非线性)变换获得更好效果的方法。Photoshop,美颜相机就是利用图像处理技术的应用程序。深度学习最重要的应用领域就是计算机视觉(CV, Computer Vision),历史上,MNIST 手写体数字识别和 ImageNet 大规模图像识别均得益于深度学习模型,取得了相比传统方法更高的准确率。从 2012 年的 AlexNet 模型开始,随后的 VGG, GoogLeNet, ResNet 等模型不断刷新 ImageNet 图像识别准确率纪录,甚至超过了人类水平。为了获得良好的识别效果,除了使用更好的模型,数据集的预处理也是十分重要的一项内容,最常用的方法有尺度缩放、随机切片、随机翻转、颜色变换等。

本文介绍如何使用 TensorFlow 完成图像数据的预处理,以及如何使用 tensorboard 工具将图像数据进行可视化。在使用 TensorFlow 实现图像识别、目标检测时会经常用到本文介绍的内容。

首先看下输入图像,是一只猫:

TensorFlow 读取图片数据代码:

reader = tf.WholeFileReader()

key, value = reader.read(tf.train.string_input_producer(['cat.jpg']))

image0 = tf.image.decode_jpeg(value)

用过 Caffe 的读者可能会非常熟悉上面的图片(位于 caffe/examples/images/cat.jpg)。原图尺寸为 360 x 480。

图像缩放

代码:

resized_image = tf.image.resize_images(image0, [256, 256], \

method=tf.image.ResizeMethod.AREA)

其中 method 有四种选择:

ResizeMethod.BILINEAR :双线性插值

ResizeMethod.NEAREST_NEIGHBOR : 最近邻插值

ResizeMethod.BICUBIC : 双三次插值

ResizeMethod.AREA :面积插值

读者可以分别试试,看看缩放效果。

图像裁剪

代码:

cropped_image = tf.image.crop_to_bounding_box(image0, 20, 20, 256, 256)

图像水平翻转

代码:

flipped_image = tf.image.flip_left_right(image0)

除此之外还可以上下翻转:

flipped_image = tf.image.flip_up_down(image0)

图像旋转

代码:

rotated_image = tf.image.rot90(image0, k=1)

其中 k 值表示旋转 90 度的次数,读者可以尝试对原图旋转 180 度、270 度。

图像灰度变换

代码:

grayed_image = tf.image.rgb_to_grayscale(image0)

从上面看到,用 TensorFlow 实现上述图像预处理是非常简单的。TensorFlow 也提供了针对目标检测中用到的 bounding box 处理的 api,有兴趣的读者可以翻阅 api 文档(https://www.tensorflow.org/versions/r1.0/api_docs/Python/image/working_with_bounding_boxes)学习。

为了方便查看图像预处理的效果,可以利用 TensorFlow 提供的 tensorboard 工具进行可视化。

使用方法也比较简单,直接用 tf.summary.image 将图像写入 summary,对应代码如下:

img_resize_summary = tf.summary.image('image resized', tf.expand_dims(resized_image, 0))

cropped_image_summary = tf.summary.image('image cropped', tf.expand_dims(cropped_image, 0))

flipped_image_summary = tf.summary.image('image flipped', tf.expand_dims(flipped_image, 0))

rotated_image_summary = tf.summary.image('image rotated', tf.expand_dims(rotated_image, 0))

grayed_image_summary = tf.summary.image('image grayed', tf.expand_dims(grayed_image, 0))

merged = tf.summary.merge_all()

with tf.Session() as sess:

summary_writer = tf.summary.FileWriter('/tmp/tensorboard', sess.graph)

summary_all = sess.run(merged)

summary_writer.add_summary(summary_all, 0)

summary_writer.close()

运行该程序,会在 /tmp/tensorboard 目录下生成 summary,接着在命令行启动 tensorboard 服务:

打开浏览器,输入 127.0.0.1:6006 就可以查看 tensorboard 页面了(Ubuntu 自带的 firefox 打开 tensorboard 时不显示图像,可以更换为 Chrome 浏览器)。

TensorBoard 图像可视化效果

TensorFlow与OpenCV,读取图片,进行简单操作并显示

1 opencv读入图片,使用tf.Variable初始化为tensor,加载到tensorflow对图片进行转置操作,然后opencv显示转置后的结果

[python] view plaincopy
  1. import tensorflow as tf
  2. import cv2
  3. file_path = "/home/lei/Desktop/"
  4. filename = "MarshOrchid.jpg"
  5. image = cv2.imread(filename, 1)
  6. cv2.namedWindow('image', 0)
  7. cv2.imshow('image', image)
  8. # Create a TensorFlow Variable
  9. x = tf.Variable(image, name='x')
  10. model = tf.initialize_all_variables()
  11. with tf.Session() as session:
  12. x = tf.transpose(x, perm=[1, 0, 2])
  13. session.run(model)
  14. result = session.run(x)
  15. cv2.namedWindow('result', 0)
  16. cv2.imshow('result', result)
  17. cv2.waitKey(0)

2 OpenCV读入图片,使用tf.placeholder符号变量加载到tensorflow里,然后tensorflow对图片进行剪切操作,最后opencv显示转置后的结果

[python] view plaincopy
  1. import tensorflow as tf
  2. import cv2
  3. # First, load the image again
  4. filename = "MarshOrchid.jpg"
  5. raw_image_data = cv2.imread(filename)
  6. image = tf.placeholder("uint8", [None, None, 3])
  7. slice = tf.slice(image, [1000, 0, 0], [3000, -1, -1])
  8. with tf.Session() as session:
  9. result = session.run(slice, feed_dict={image: raw_image_data})
  10. print(result.shape)
  11. cv2.namedWindow('image', 0)
  12. cv2.imshow('image', result)
  13. cv2.waitKey(0)

参考资料:

http://learningtensorflow.com/

http://stackoverflow.com/questions/34097281/how-can-i-convert-a-tensor-into-a-numpy-array-in-tensorflow

TensorFlow与OpenCV,读取图片,进行简单操作并显示相关推荐

  1. DALSA线阵CCD相机开发 之 opencv读取图片

    SDK的下载 Sapera_LT_8.31_SDK 百度网盘下载地址:链接:密码:ckm7. SDK的安装 解压运行.exe文件,按照提示确定,下一步即可. 帮助文档和demo 如果要获得完整的帮助文 ...

  2. Python学习(1)OpenCV读取图片

    Python学习(1)OpenCV读取图片 前言 一. Python准备 二. Python仿真 三. 仿真结果 四. 小结 前言 随着人工智能研究的不断兴起,Python的应用也在不断上升,由于Py ...

  3. python下Opencv读取图片

    python下Opencv读取图片 import cv2 #cv2.imread默认读入模式是1,表彩色:0表示灰色 im = cv2.imread('images/1039.jpg') #注意这里的 ...

  4. OpenCV读取图片顺序

    遇到一个问题,读取的图片颜色一直偏紫色,后来知道是因为OpenCv读取图片的顺序是BGR. import cv2 import matplotlib.pyplot as pltimg = cv2.im ...

  5. opencv读取图片失败

    遇到一个问题,无论如何设置路径,总是无法读取到指定的图片.后来仔细修改发现问题所在,原因就在于opencv的配置问题.在调试的时候,程序需要的dll是以d结尾的,但是配置的时候可能release和de ...

  6. opencv读取图片HWC转CHW

    Opencv读取图片HWC转CHW 在读取图片时,一般可采取PIL或cv2实现,但是二者读取得到的数据格式有些不同. 对于给定的RGB图片,当使用PIL加载图片时,可将其直接转换为[C,H,W]的te ...

  7. python opencv 读取图片_Python opencv 读取图像

    对于 matlab 起家做数字图像处理的人来讲都非常适应matlab对图像处理的操作和思路,尤其是它可以非常方便直观的看到图像的RGB值. 由于最近在研究深度学习的计算机视觉方面的东西,于是完全自学接 ...

  8. Python 技术篇-使用opencv读取图片实例演示,python安装opencv库

    安装非常简单,只需要pip install opencv-python就好了. 下面展示用 opencv 读取一张图片,并展示. #!/user/bin/env python # -*- coding ...

  9. opencv读取图片、视频、摄像头

    计算机视觉处理,少不了需要会opencv,所以下面练习一下. # -*- coding: utf-8 -*- """ Created on Mon Jan 22 10:3 ...

最新文章

  1. 关于C++模版的连接错误问题
  2. 百度网盘的这个收作业的功能不好用
  3. Java多线程之线程通信之生产者消费者阻塞队列版
  4. 全连接层 时间复杂度_神经网络全连接层(3)
  5. Transactional cannot be resolved to a type
  6. 信息学奥赛C++语言:输出学生序号与成绩
  7. python itemgetter函数用法_Python itemgetter函数怎么用?
  8. HDOJ 2030-汉字统计
  9. php drive mssql,wamp下对MS SQLSERVER的连接配置,PHP+THINKPHP5通过
  10. 互联网系统架构的演进
  11. 十五、K8s helm包管理与应用
  12. 第三方调试助手的与S7-1200 PLC的通信
  13. CSS 动画 animation
  14. viewport的width值应该怎么设置
  15. c语言中变量属性,C语言学习笔记--C语言中变量的属性关键字
  16. mac——清理磁盘空间
  17. 8.6 自制操作系统: risc-v Machine寄存器mcounteren/mcountinhibit
  18. SIGCOMM‘2021 Congestion Detection in Lossless Networks 阅读笔记
  19. 【5G系列】MICO学习总结(2)
  20. 休闲娱乐 - 种花记

热门文章

  1. 概要设计实例_多核片上系统(SoC)架构的嵌入式DSP软件设计
  2. C++ 偏微分数值计算库_【动手学计算机视觉】第一讲:图像预处理之图像去噪...
  3. 【c语言】蓝桥杯基础练习 查找整数
  4. matlab传递闭包动态聚类图,用SPSS制作3D散点图全方位动态展示K均值聚类效果
  5. 关于Quartz的Job 不能被注入以及SpringAop对Job失效
  6. 部署ArcGIS JS API 离线包(Tomcat与IIS)
  7. Java8 - 接口默认方法
  8. linux中设置程序开机自动启动
  9. WinRT界面控件Essential Studio上如何选择时间范围
  10. nodeType 节点简介