1 场景

YOLO全称You Only Look Once,YOLO实现了自动驾驶汽车等前沿技术中使用的实时对象检测。

可以实现对图像中的对象进行识别和定位,如下效果:

1.png

这里不研究算法,只研究,在python环境下,如何使用yolo进行图像中物体的识别和定位。

2 官网

2.1 官方地址

YOLO使用相关网站如下:

github地址:

2.2 百度网盘

如下为作者在百度网盘中备份的相关文件(配置文件+演示文件):

3 版本

python:3.6.3

4 依赖

(1)安装cv2依赖

pip install opencv-python

(2)安装numpy依赖

pip install numpy

4 代码

4.1 准备

(1)创建yolo配置文件

创建配置文件夹:cfg

将配置文件下载后,拷贝到cfg配置文件中:

(2)创建测试文件夹

测试文件夹:yoloSrc

输出文件夹:yoloRes

4.2 引入依赖

import cv2

import numpy as np

import os

import time

4.3 定义函数

def yolo_detect(pathIn='',

pathOut=None,

label_path='cfg/coco.names',

config_path='cfg/yolov3.cfg',

weights_path='cfg/yolov3.weights',

confidence_thre=0.5,

nms_thre=0.3,

jpg_quality=80):

'''

pathIn:原始图片的路径

pathOut:结果图片的路径

label_path:类别标签文件的路径

config_path:模型配置文件的路径

weights_path:模型权重文件的路径

confidence_thre:0-1,置信度(概率/打分)阈值,即保留概率大于这个值的边界框,默认为0.5

nms_thre:非极大值抑制的阈值,默认为0.3

jpg_quality:设定输出图片的质量,范围为0到100,默认为80,越大质量越好

'''

# 加载类别标签文件

LABELS = open(label_path).read().strip().split("\n")

nclass = len(LABELS)

# 为每个类别的边界框随机匹配相应颜色

np.random.seed(42)

COLORS = np.random.randint(0, 255, size=(nclass, 3), dtype='uint8')

# 载入图片并获取其维度

base_path = os.path.basename(pathIn)

img = cv2.imread(pathIn)

(H, W) = img.shape[:2]

# 加载模型配置和权重文件

print('从硬盘加载YOLO......')

net = cv2.dnn.readNetFromDarknet(config_path, weights_path)

# 获取YOLO输出层的名字

ln = net.getLayerNames()

ln = [ln[i[0] - 1] for i in net.getUnconnectedOutLayers()]

# 将图片构建成一个blob,设置图片尺寸,然后执行一次

# YOLO前馈网络计算,最终获取边界框和相应概率

blob = cv2.dnn.blobFromImage(img, 1 / 255.0, (416, 416), swapRB=True, crop=False)

net.setInput(blob)

start = time.time()

layerOutputs = net.forward(ln)

end = time.time()

# 显示预测所花费时间

print('YOLO模型花费 {:.2f} 秒来预测一张图片'.format(end - start))

# 初始化边界框,置信度(概率)以及类别

boxes = []

confidences = []

classIDs = []

# 迭代每个输出层,总共三个

for output in layerOutputs:

# 迭代每个检测

for detection in output:

# 提取类别ID和置信度

scores = detection[5:]

classID = np.argmax(scores)

confidence = scores[classID]

# 只保留置信度大于某值的边界框

if confidence > confidence_thre:

# 将边界框的坐标还原至与原图片相匹配,记住YOLO返回的是

# 边界框的中心坐标以及边界框的宽度和高度

box = detection[0:4] * np.array([W, H, W, H])

(centerX, centerY, width, height) = box.astype("int")

# 计算边界框的左上角位置

x = int(centerX - (width / 2))

y = int(centerY - (height / 2))

# 更新边界框,置信度(概率)以及类别

boxes.append([x, y, int(width), int(height)])

confidences.append(float(confidence))

classIDs.append(classID)

# 使用非极大值抑制方法抑制弱、重叠边界框

idxs = cv2.dnn.NMSBoxes(boxes, confidences, confidence_thre, nms_thre)

# 确保至少一个边界框

if len(idxs) > 0:

# 迭代每个边界框

for i in idxs.flatten():

# 提取边界框的坐标

(x, y) = (boxes[i][0], boxes[i][1])

(w, h) = (boxes[i][2], boxes[i][3])

# 绘制边界框以及在左上角添加类别标签和置信度

color = [int(c) for c in COLORS[classIDs[i]]]

cv2.rectangle(img, (x, y), (x + w, y + h), color, 2)

text = '{}: {:.3f}'.format(LABELS[classIDs[i]], confidences[i])

(text_w, text_h), baseline = cv2.getTextSize(text, cv2.FONT_HERSHEY_SIMPLEX, 0.5, 2)

cv2.rectangle(img, (x, y - text_h - baseline), (x + text_w, y), color, -1)

cv2.putText(img, text, (x, y - 5), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (0, 0, 0), 2)

# 输出结果图片

if pathOut is None:

cv2.imwrite('with_box_' + base_path, img, [int(cv2.IMWRITE_JPEG_QUALITY), jpg_quality])

else:

cv2.imwrite(pathOut, img, [int(cv2.IMWRITE_JPEG_QUALITY), jpg_quality])

4.4 使用

if __name__ == '__main__':

yolo_detect('yoloSrc/trunk.jpg', 'yoloRes/trunk.jpg')

4.5 结果

输出日志:

从硬盘加载YOLO......

YOLO模型花费 1.75 秒来预测一张图片

(1)原文件

trunk.jpg

(2)输出结果

监测结果为truck,后面的0.999为对象匹配度。

trunk-2.jpg

yolo算法python代码_python通过yolo算法识别图片中的对象相关推荐

  1. 谱聚类python代码_Python 谱聚类算法从零开始

    谱聚类算法是一种常用的无监督机器学习算法,其性能优于其他聚类方法. 此外,谱聚类实现起来非常简单,并且可以通过标准线性代数方法有效地求解. 在谱聚类算法中,根据数据点之间的相似性而不是k-均值中的绝对 ...

  2. 中文分词算法python代码_python实现中文分词FMM算法实例

    本文实例讲述了python实现中文分词FMM算法.分享给大家供大家参考.具体分析如下: FMM算法的最简单思想是使用贪心算法向前找n个,如果这n个组成的词在词典中出现,就ok,如果没有出现,那么找n- ...

  3. 随机森林分类算法python代码_Python机器学习笔记:随机森林算法

    随机森林算法的理论知识 随机森林是一种有监督学习算法,是以决策树为基学习器的集成学习算法.随机森林非常简单,易于实现,计算开销也很小,但是它在分类和回归上表现出非常惊人的性能,因此,随机森林被誉为&q ...

  4. knn算法python代码_K-最近邻分类算法(KNN)及python实现

    一.引入 问题:确定绿色圆是属于红色三角形.还是蓝色正方形? KNN的思想: 从上图中我们可以看到,图中的数据集是良好的数据,即都打好了label,一类是蓝色的正方形,一类是红色的三角形,那个绿色的圆 ...

  5. 中文分词算法python代码_中文分词算法之最大正向匹配算法(Python版)

    最大匹配算法是自然语言处理中的中文匹配算法中最基础的算法,分为正向和逆向,原理都是一样的. 正向最大匹配算法,故名思意,从左向右扫描寻找词的最大匹配. 首先我们可以规定一个词的最大长度,每次扫描的时候 ...

  6. apriori算法python代码_通俗易懂Apriori算法及Python实现

    本篇分为三个部分: 一.算法背景 啤酒与尿布故事: 某超市为增加销售量,提取出了他们超市所有的销售记录进行分析.在对这些小票数据进行分析时,发现男性顾客在购买婴儿尿片时,通常会顺便搭配带打啤酒来犒劳自 ...

  7. 人工鱼群算法python代码_人工鱼群算法python_鱼群算法 - Brillou的个人空间 - OSCHINA - 中文开源技术交流社区......

    本算法是参照李晓磊博士的论文实现的,详细的算法原理可阅读<一种新型的智能优化方法_人工鱼群算法_李晓磊> 算法基于鱼群的生存行为:在一片水域中,鱼存在的数目最多的地方就是本水域中富含营养物 ...

  8. slope one 推荐算法python 代码_协同推荐算法实践之Slope One的介绍(转)

    Slope One 之一 : 简单高效的协同过滤算法(转)(

  9. 多元线性回归算法python实现_手写算法-Python代码推广多元线性回归

    1.梯度下降-矩阵形式 上篇文章介绍了一元线性回归,包括Python实现和sklearn实现的实例.对比,以及一些问题点,详情可以看这里: 链接: 手写算法-Python代码实现一元线性回归 里面封装 ...

  10. 手写算法-python代码实现Ridge(L2正则项)回归

    手写算法-python代码实现Ridge回归 Ridge简介 Ridge回归分析与python代码实现 方法一:梯度下降法求解Ridge回归参数 方法二:标准方程法实现Ridge回归 调用sklear ...

最新文章

  1. 最优的去重处理——HashSet去重
  2. 解决Android 7.0 App内切换语言不生效的问题
  3. FileZilla Server安装配置教程
  4. 关于VS项目平台的x86,x64,Any CPU以及Debug和Release
  5. 【NLP】Pytorch中文语言模型bert预训练代码
  6. Spring boot(九):定时任务
  7. 详解ASP.NET页面生命周期事件
  8. win10推荐的锁屏壁纸该怎么保存 win10休眠锁屏壁纸保存
  9. ASP.NET Core 入门教程 6、ASP.NET Core MVC 视图布局入门 1
  10. 苹果8黑屏无法强制开机_iphonexsmax死机黑屏,iphonexsmax无法开机
  11. Hive入门学习随笔(二)
  12. 证券行业信息技术规范
  13. Linux驱动开发: FrameBuffe(LCD)驱动开发
  14. 44、Search contract
  15. python图片自动上色_自己实现黑白图片自动上色AI(一)
  16. Unity 制作数字图片字体
  17. 国外LEAD域名邮箱获取途径
  18. 2020 China Collegiate Programming Contest Weihai Site H.Message Bomb
  19. 用java做出聊天工具
  20. 编码时需要注意的地方

热门文章

  1. 基于51单片机的交通灯控制设计
  2. yum install gcc报错Error: Package: glibc-2.17-260.el7_6.6.i686 (updates) Requires: glibc-common = 2.17
  3. 恒定湿热试验条件及标准-环境试验中的湿热试验报告
  4. c语言专家编程,读书笔记
  5. 从刷卡到二维码再到刷脸,无现金方式如何掀起支付革命?丨Xtecher 视角
  6. 《学习之道》第十章学习方法28再次提到番茄时间
  7. mac 安装Xshell4
  8. mysql数据库url正确的是_下面关于连接mysql下的mydb数据库的url,编写正确的是()...
  9. plsql 备份还原 教程_PLSQL导出还原数据库
  10. 候鸟浏览器cookie登录教程