点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

通常,数据科学家会建立一个图像识别模型,观察其准确性,如果足够高,就表示工作完成了。

然而,自从我开始学习机器学习,我就一直不明白这一点,为什么要花费所有的时间来建立最好的模型——只是为了满足于一个数字?

在本文中,将提供代码并指导你如何通过构建与模型交互的拍照接口来真正完成项目。

安装cv2(OpenCV)

我们将使用的图像库是cv2。因为cv2不能在Kaggle这样的在线平台上工作,所以它必须在你的计算机上本地完成。然而,模型的权重仍然可以在Kaggle上进行训练,以.h5文件的形式下载(基于Keras/TensorFlow)并加载。

在Anaconda或命令提示符中键入

conda create -n opencv python=3.6

这将在Python版本3.6中创建一个名为opencv的新环境,可以用正在使用的任何版本替换它。

下一步,输入

pip install opencv-python

你已经成功安装了cv2! 现在你可以开始拍照了。

用cv2拍照

首先,导入库。

import cv2

接下来,我们必须创建一个视频捕获实例。你可以测试实例是否能够连接到你的相机(如果没有,请检查你的设置以确保应用程序可以访问它)。

cap = cv2.VideoCapture(0)
if not (cap.isOpened()):print("Video device not connected.")

最后,是时候拍照了。如果要控制拍摄照片的时间,第一行将指定任意变量和输入。除非输入了某些内容(如按“回车”),然后下一行开始拍照,否则程序无法继续。拍摄图像时,你可能会看到网络摄像头指示灯很快出现。第三行关闭连接,第四行销毁访问相机的所有实例。

arb = input('Press enter to take picture.')
ret, frame = cap.read()
cap.release()
cv2.destroyAllWindows()

图像中的数据存储在frame中。可以使用以下代码将其转换为数组:

cv2_im = cv2.cvtColor(frame,cv2.COLOR_BGR2RGB)

调用cv2_im.shape时,输出为(480640,3)。因此,图像(对于我的相机)是480×640像素(3表示“深度”, 每个像素中有三个值说明创建最终像素颜色需要包含红色、绿色和蓝色)。

现在图像已转换为数组,matplotlib的imshow()可以显示它。

import matplotlib.pyplot as plt
plt.imshow(cv2_im)
plt.show()

完整代码:

import cv2
import matplotlib.pyplot as plt
cap = cv2.VideoCapture(10)
if not (cap.isOpened()):print("Video device unconnected.")
arb = input('Press enter to take picture.')
ret, frame = cap.read()
cap.release()
cv2.destroyAllWindows()
cv2_im = cv2.cvtColor(frame,cv2.COLOR_BGR2RGB)
plt.imshow(cv2_im)
plt.show()

格式化为模型标准格式

卷积神经网络只接受固定大小的图像,例如(100,100,3)。有几种方法可以做到这一点。

为了保持图像的比例长度,可以尝试裁剪图像。

一般语法是:

plt.imshow(cv2_im[y_upper_bound:y_lower_bound,x_lower_bound:x_higher_bound])

其中“upper”和“lower”由图像上的位置确定(y的“upper”表示图像的上方,x的“upper”表示图像的右侧)。

例如,

plt.imshow(cv2_im[100:400,100:400])

这里把照片裁剪成正方形。

但是,尺寸仍然是300×300。为了解决这个问题,我们将再次使用Pillow:

pil_image = Image.fromarray(cv2_im[100:400,100:400])
width = 100
height = 100
pil_image = pil_image.resize((width,height), Image.ANTIALIAS)

NumPy自动将Pillow图像转换为数组。

import numpy as np
cv2_im_new = np.array(pil_image)

查看新图像:

plt.imshow(cv2_im_new)

好多了!图像的新形状是(100,100,3), 非常适合我们的模型。

在模型中运行

现在我们有了NumPy数组,只需将其传递到模型中即可。

model.predict(cv2_im_new)

基于此,通过一些手动编码来标记图像的真实标签,可以在title中标记它们:

plt.imshow(cv2_im_new)
plt.title('Hand Gesture: '+classification)

在本教程中,你将学习如何实现一个简单的拍照界面,以查看你的机器学习模型的实际应用性能。

原文链接:https://towardsdatascience.com/building-an-image-taking-interface-application-for-your-image-recognition-model-973b121cc9d9

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

使用Python+OpenCV实现图像数据采集相关推荐

  1. Python+OpenCV:图像修复(Image Inpainting)

    Python+OpenCV:图像修复(Image Inpainting) 理论 Most of you will have some old degraded photos at your home ...

  2. Python+OpenCV:图像二进制鲁棒独立基本特征(BRIEF, Binary Robust Independent Elementary Features)

    Python+OpenCV:图像二进制鲁棒独立基本特征(BRIEF, Binary Robust Independent Elementary Features) 理论 We know SIFT us ...

  3. Python+OpenCV:图像快速角点检测算法(FAST Algorithm for Corner Detection)

    Python+OpenCV:图像快速角点检测算法(FAST Algorithm for Corner Detection) 理论 Feature Detection using FAST Select ...

  4. Python+OpenCV:图像Shi-Tomasi角点检测器

    Python+OpenCV:图像Shi-Tomasi角点检测器 理论 The scoring function in Harris Corner Detector was given by: Inst ...

  5. Python+OpenCV:图像Harris角点检测(Harris Corner Detection)

    Python+OpenCV:图像Harris角点检测(Harris Corner Detection) 理论 corners are regions in the image with large v ...

  6. Python+OpenCV:图像对比度受限自适应直方图均衡化(CLAHE, Contrast Limited Adaptive Histogram Equalization)

    Python+OpenCV:图像对比度受限自适应直方图均衡化(CLAHE, Contrast Limited Adaptive Histogram Equalization) ############ ...

  7. Python+OpenCV:图像轮廓

    Python+OpenCV:图像轮廓 轮廓是什么? 轮廓可以简单地解释为一条连接所有连续点(沿边界)的曲线,具有相同的颜色和强度. 轮廓线是形状分析.目标检测和识别的重要工具. 为了获得更好的精度,可 ...

  8. Python+OpenCV:图像金字塔

    Python+OpenCV:图像金字塔 理论 通常情况下,我们使用固定大小的图像.但在某些情况下,我们需要处理(相同的)不同分辨率的图像. 例如,当搜索图像中的某些东西时,比如脸,我们不确定该物体在图 ...

  9. Python+OpenCV:图像梯度

    Python+OpenCV:图像梯度(Image Gradients) 理论 OpenCV提供了三种类型的梯度滤波器或高通滤波器,Sobel, Scharr和Laplacian. 1. Sobel和S ...

最新文章

  1. Python绘图之matplotlib基础教程:matplotlib库图表绘制中常规设置大全(交互模式、清除原有图像、设置横坐标显示文字/旋转角度、添加图例、绘图布局自动调整、图像显示、图像暂停)
  2. MyBatis学习 之 二、SQL语句映射文件(1)resultMap
  3. 【视频】vue指令之v-if、v-bind
  4. 评审恩仇录——我为什么愿意执行代码评审
  5. 针对新手的Java EE7和Maven项目–第1部分–简单的Maven项目结构–父pom
  6. 配置源码管理工具(2)
  7. mplayer安装记录 源码分析
  8. 使用 TRESTClient 與 TRESTRequest 作為 HTTP Client 之二 (POST 檔案)
  9. [C++设计模式] command 命令模式
  10. 华为面试题算什么,这个背会了外企随便进
  11. 自定义cobbler安装系统菜单界面
  12. TextMesh Pro不能显示中文的解决办法是创建字贴图,常用汉字3500
  13. 绝了!深入分布式缓存从原理到实践技术分享,超详细
  14. 解决Windows无法加载中文(中国)-王码五笔输入法 86版 键盘的布局的方法
  15. 【Windows 8】pid为4的system进程占用80端口的解决办法
  16. 复杂性思维第二版 三、小世界图
  17. Jetson Nano交叉编译教程
  18. 九九乘法表居中c语言,JavaScript实现九九乘法表的简单实例
  19. Photoshop小技巧 (去掉照片中多余的人物)
  20. 移动端vue仿朋友圈项目总结

热门文章

  1. 蚂蚁金服提新概率图模型GLN,正确率提升8.2%,具备可解释性 | NeurIPS 2019
  2. 率清华团队研发“天机芯”登《Nature》封面,他说类脑计算是发展人工通用智能的基石...
  3. TensorFlow 2.0来了,为什么他却说“深度学习框架之争,现在谈结果为时尚早”?...
  4. 公开课 | 人脸识别的最新进展以及工业级大规模人脸识别实践探讨
  5. 详解CPU漏洞对机器学习的影响:几乎所有卷积层都受影响,QR分解降速37%
  6. 不服来战!多伦多大学教授500美元挑战整个机器学习圈子
  7. 国内最牛的Java面试八股,真offer收割机!
  8. 离开互联网上岸1年后,我后悔了!重回大厂内卷
  9. 没错,使用 Nacos 踩坑了
  10. 你说,一个Java字符串到底有多少个字符?