上一期中,ofter介绍了计算机视觉的常用神经网络模型,以及如何选择模型,今天我们就趁热打铁拿个实际的模型跑跑,欢迎大家跨入数据科学家们的世界。

一、机器学习的目标

作为数据科学家,我们必须明白投入大量时间精力进行机器学习、深度学习的目的是什么?将非结构化、低密度、低价值的大数据转换为高密度和高价值数据。当我们对张三发布的某张照片进行内容识别的时候,这张照片就是非结构化、低密度、低价值的数据;但是当我们对他多年发布的N张照片进行内容识别后,我们大概率可以分析得出张三的生活习惯、爱好、朋友圈等等。

二、机器学习的步骤

  1. 确定需要使用的框架、预训练模型、编程语言;
  2. 准备需要训练的数据集;
  3. 预处理数据;
  4. 构建模型;
  5. 训练模型;
  6. 使用训练好的模型。

三、图像检测实战应用

数据科学家的主要任务是使用正确或表现良好的模型进行数据分析的实际应用。因此,今天ofter以图像检测为例,使用训练好的模型测试下检测效率和效果。本案例使用的框架Tensorflow+Keras,训练好的模型RetinaNet,编程语言python。其中,训练好的模型,大家可以从modelzoo中或其他途径搜索https://modelzoo.co/

3.1 引用所需模块

看上图,我们可以知道需要对识别的图片绘制边框和打印识别标签,因此,除了引用keras_retinanet模型模块以外,我们还需要引用可视化绘制图表、绘制边框、打标签、设置标签颜色的模块。

from keras_retinanet import models
from keras_retinanet.utils.image import read_image_bgr, preprocess_image, resize_image
from keras_retinanet.utils.visualization import draw_box, draw_caption
from keras_retinanet.utils.colors import label_color
import matplotlib.pyplot as plt
import cv2
import os
import numpy as np
import time
import sys
sys.path.insert(0, '../')

3.2 加载RetinaNet模型

# 加载已经训练好的retinanet模型
model_path = os.path.join('..', 'snapshots', 'resnet50_coco_best_v2.1.0.h5')
model = models.load_model(model_path, backbone_name='resnet50')
print(model.summary())
# 标签名称映射
labels_to_names = {0: 'person', 1: 'bicycle', 2: 'car', 3: 'motorcycle', 4: 'airplane', 5: 'bus', 6: 'train', 7: 'truck', 8: 'boat', 9: 'traffic light', 10: 'fire hydrant', 11: 'stop sign', 12: 'parking meter', 13: 'bench', 14: 'bird', 15: 'cat', 16: 'dog', 17: 'horse', 18: 'sheep', 19: 'cow', 20: 'elephant', 21: 'bear', 22: 'zebra', 23: 'giraffe', 24: 'backpack', 25: 'umbrella', 26: 'handbag', 27: 'tie', 28: 'suitcase', 29: 'frisbee', 30: 'skis', 31: 'snowboard', 32: 'sports ball', 33: 'kite', 34: 'baseball bat', 35: 'baseball glove', 36: 'skateboard', 37: 'surfboard', 38: 'tennis racket', 39: 'bottle', 40: 'wine glass', 41: 'cup', 42: 'fork', 43: 'knife', 44: 'spoon', 45: 'bowl', 46: 'banana', 47: 'apple', 48: 'sandwich', 49: 'orange', 50: 'broccoli', 51: 'carrot', 52: 'hot dog', 53: 'pizza', 54: 'donut', 55: 'cake', 56: 'chair', 57: 'couch', 58: 'potted plant', 59: 'bed', 60: 'dining table', 61: 'toilet', 62: 'tv', 63: 'laptop', 64: 'mouse', 65: 'remote', 66: 'keyboard', 67: 'cell phone', 68: 'microwave', 69: 'oven', 70: 'toaster', 71: 'sink', 72: 'refrigerator', 73: 'book', 74: 'clock', 75: 'vase', 76: 'scissors', 77: 'teddy bear', 78: 'hair drier', 79: 'toothbrush'}

其中
resnet50_coco_best_v2.1.0.h5是已经训练过数据集的文件。当我们加载模型时,可以看下该模型的网络结构。

3.3 图像识别代码

# 测试图片
image = read_image_bgr('house.png')
# 图片转换为RGB格式
draw = image.copy()
draw = cv2.cvtColor(draw, cv2.COLOR_BGR2RGB)
# 预处理图片
image = preprocess_image(image)
image, scale = resize_image(image)
# 处理图片
start = time.time()
boxes, scores, labels = model.predict_on_batch(np.expand_dims(image, axis=0))
# 输出图片处理时间
print("processing time: ", time.time() - start)
# 纠正图片比例
boxes /= scale
# 实例检测
for box, score, label in zip(boxes[0], scores[0], labels[0]):if score < 0.5:breakcolor = label_color(label)b = box.astype(int)draw_box(draw, b, color=color)caption = "{} {:.3f}".format(labels_to_names[label], score)draw_caption(draw, b, caption)
# 输出图片识别结果
plt.figure(figsize=(15, 15))
plt.axis('off')
plt.imshow(draw)
plt.show()

原图:

检测后:

一般,我们会对识别分score<0.5的进行剔除,当然,我们也可以提高识别分,或者降低识别分,比如降低到score<0.1的剔除,那么识别的内容会有更多的可能性。

四、完整的机器学习

当然,如果你想要学习完整的机器学习步骤,ofter推荐一个网址:

https://tensorflow.google.cn/tutorials/keras/classification?hl=zh-cn

本案例的代码下载地址:

https://github.com/fizyr/keras-retinanet

[5机器学习]python计算机视觉应用-图片内容识别相关推荐

  1. 资料网址大全 (数学,深度学习,机器学习,计算机视觉,人脸识别,图像处理等)

    数学: PCA详解:http://blog.codinglabs.org/articles/pca-tutorial.html (PCA降维通俗易懂讲解,推荐) 傅里叶级数和傅里叶变换通俗讲解:htt ...

  2. Python计算机视觉——图像检索与识别

    目录 一.原理解析 1.1计算机视觉的图像分类是什么意思? 1.2图像分类如何实现? 1.3Bag of features算法和过程 1)提取图像特征 2)训练字典 3)图像直方图生成 4)训练分类器 ...

  3. python计算机视觉--基于(BOW)的图像检索与识别

    目录 前言 一.基本原理 1.1 图像分类简介 1.2 Bag-of-words模型 1.3 Bag-of-features模型 1.4  Bag-of-features算法 1.5  Bag-of- ...

  4. Python 计算机视觉(十六)—— 图像和视频中的人脸识别

    参考的一些文章以及论文我都会给大家分享出来 -- 链接就贴在原文,论文我上传到资源中去,大家可以免费下载学习,如果当天资源区找不到论文,那就等等,可能正在审核,审核完后就可以下载了.大家一起学习,一起 ...

  5. python垃圾短信识别_Scikit-Learn机器学习实践:垃圾短信识别

    机器学习与垃圾短信识别 前不久,我们使用NLTK的贝叶斯分类模型垃圾对短信数据进行机器学习的垃圾短信识别. 其实除了使用NLTK,我们还可以使用Scikit-Learn这个集成了诸多机器学习算法的模块 ...

  6. Python实现猫脸识别 | 喵主子福利

    点击关注我哦 一篇文章带你了解Python实现猫脸识别 本文将向您展示如何编写一个简单的猫脸检测程序.在程序中同时结合了人脸和猫脸的检测模型,让机器学会区分人和猫.这听起来就像是非常有趣的一个项目~ ...

  7. 共有65款 计算机视觉库/人脸识别开源软件

    转载:https://www.cnblogs.com/Anita9002/p/5038533.html. 引自:http://www.oschina.net/project/tag/316/openc ...

  8. 基于SpringBoot+Python多语言银行卡识别系统

    计算机视觉(Computer Vision)又称为机器视觉(Machine Vision),顾名思义是一门"教"会计算机如何去"看"世界的学科.在机器学习大热的 ...

  9. 计算机视觉库/人脸识别开源软件

    中文车牌识别系统 EasyPR EasyPR 是一个开源的中文车牌识别系统. EasyPR是一个中文的开源车牌识别系统,其目标是成为一个简单.灵活.准确的车牌识别引擎. 相比于其他的车牌识别系统,Ea ...

  10. Python计算机视觉——SIFT特征

    Python计算机视觉--SIFT特征 文章目录 Python计算机视觉--SIFT特征 写在前面 1 SIFT特征算法步骤 1.1 尺度空间的极值检测 1.2 特征点定位 1.3 特征方向赋值 1. ...

最新文章

  1. python所有插件框架_Python中实现简单的插件框架
  2. Python小知识: List的赋值方法,不能直接等于
  3. 交互式计算机图形学总结:第五章 光照和明暗绘制
  4. Python Django 日期增减API
  5. 刚刚,阿里开源了一系列重磅技术炸弹!| 程序员必看
  6. Farseer.Net ORM开源框架 V0.x 教程目录
  7. 如何使用JPA和Hibernate映射JSON集合
  8. oracle左连接查询代码,ORACLE连接查询,内外连接
  9. Css学习总结(5)——CSS常见布局方式
  10. Redis入门之 redis set集合的操作
  11. TM数据单窗算法和单通道算法反演地表温度(IDL实现)
  12. 优秀 java工程师 简历
  13. php ini 分号,PHP.ini配置里这些开头的分号是什么意思
  14. led屏背后线路安装图解_液晶拼接屏安装方法图解及接线方法
  15. web前端之过滤器的作用
  16. UEFI----EFI_DRIVER_BINDING_PROTOCOL
  17. 听说ES6中新增了能够与众不同的Symbol数据类型
  18. 鲁大师2021半年报电动车智能排行:九号霸榜,造车新势力崛起!
  19. java 给excel添加一列_java操作excel在开始位置添加一列
  20. msgbox.html5.qq .com,霸道总裁之代码强势表白

热门文章

  1. 石油大 2019年我能变强组队训练赛第四场 J Cunning Friends(三人博弈)
  2. 利用Excel进行多张表的合并计算,操作简单
  3. 掘金「跳转外链风险提示」实现思考
  4. 流量卡之家:AI、无人机、物联网、自动驾驶 未来取决于5G
  5. Nginx服务器软件学习记录
  6. 香港希玛眼科集团第二届眼科精准医疗国际会议在京启幕
  7. matlab与vb接口dll,[求助]vb和matlab接口有关matlab程序调用vb数组的问题
  8. 多文件自平衡云传输 (一) 资源篇 —————— 开开开山怪
  9. LeetCode 506 Relative Ranks
  10. 网页版在线使用PS网站源码