10行代码带你搞定目标检测(附代码)
来源:大数据文摘
本文约2700字,建议阅读5分钟。
本文介绍采用代码搞定目标检测的技术。
计算机视觉是人工智能的一个重要领域,是关于计算机和软件系统的科学,可以对图像和场景进行识别、理解。计算机视觉还包括图像识别、目标检测、图像生成、图像超分辨率重建等多个领域。由于存在大量的实际需求,目标检测可能是计算机视觉中最有意义的领域。
目标检测是指计算机和软件系统对图像或场景中的目标进行定位和识别的任务。目标检测已广泛应用于人脸检测、车辆检测、人流量统计、网络图像、安防系统和无人驾驶等多个领域。
在应用或系统中使用目标检测方法,以及基于这些方法构建新的应用都不是简单的任务。早期目标检测的实现基于经典算法,比如流行的计算机视觉库OpenCV中支持的算法。然而,这些经典算法在不同的条件下无法获得稳定的性能。
2012年深度学习的突破性进展和迅速普及,使得R-CNN、Fast-RCNN、Faster-RCNN、RetinaNet以及快速高度准确的SSD、YOLO等目标检测算法应运而生。这些基于深度学习、机器学习的算法,需要一定的数学以及深度学习框架基础。有数百万的专业计算机程序员和软件开发人员想要集成和创建基于目标检测算法的新产品。同时由于理解和实际使用较为复杂,一直无法实现。如何开发出高效的目标检测代码呢?ImageAI就应运而生了。
ImageAI让代码变得简洁
ImageAI是一个python库,只需要几行代码,就可以让程序员和软件开发人员轻松地将最先进的计算机视觉技术集成到他们现有的或新的应用中,ImageAI已经在Github上开源。
Github地址:
https://github.com/OlafenwaMoses/ImageAI
ImageAI目前支持使用在ImageNet-1000数据集上训练的4种不同机器学习算法进行图像预测和训练。ImageAI还支持使用在COCO数据集上训练的RetinaNet,YOLOv3和TinyYOLOv3进行对象检测,视频检测和对象跟踪。最后,ImageAI允许训练自定义模型,以执行新目标的检测和识别。
ImageAI库有依赖其他Python库,所以在使用ImageAI开发之前还需要导入其他的包。
准备工作
使用ImageAI实现目标检测,只需进行以下4步:
在你的电脑上安装Python
安装ImageAI,配置依赖环境
下载目标检测模块文件
运行样例代码(只需10行)
下面一步步详细展开:
1)从Python官网下载并安装Python3
链接地址:
https://python.org
2)用pip命令安装以下依赖包:
i. Tensorflow
br
ii. Numpy
br
iii. SciPy
br
iv. OpenCV
br
v. Pillow
br
vi. Matplotlib
br
vii. H5py
br
viii. Keras
br
ix. ImageAI
pip3 install imageai --upgrade
br
注意:第一次安装ImageAI库,需要下载对应版本的.whl文件,小编的电脑是Python3的环境,所以下载了imageai-2.0.2-py3-none-any.whl 文件,然后转移到相应的文件夹下,执行如下命令即可安装:
pip install imageai-2.0.2-py3-none-any.whl
br
.whl文件链接地址:
https://github.com/OlafenwaMoses/ImageAI/releases/download/2.0.2/imageai-2.0.2-py3-none-any.whl
3)下载用于目标检测的RetinaNet模型文件
链接地址:
https://github.com/OlafenwaMoses/ImageAI/releases/download/1.0/resnet50_coco_best_v2.0.1.h5
开启10行代码的目标检测
到这里你已经安装好了所有的依赖项,可以开始编写你的第一个目标检测的代码了。
创建一个Python文件并命名(如FirstDetection.py),然后将下面的代码写入该文件。将RetinaNet模型文件和要检测的图像复制到包含Python文件的文件夹中。
FirstDetection.py:
from imageai.Detection import ObjectDetectionimport osexecution_path = os.getcwd()detector = ObjectDetection()detector.setModelTypeAsRetinaNet()detector.setModelPath( os.path.join(execution_path , "resnet50_coco_best_v2.0.1.h5"))detector.loadModel()detections = detector.detectObjectsFromImage(input_image=os.path.join(execution_path , "image.jpg"), output_image_path=os.path.join(execution_path , "imagenew.jpg"))for eachObject in detections: print(eachObject["name"] , " : " , eachObject["percentage_probability"] )
br
然后运行代码,等待结果输出。结果显示后,就可以在FirstDetection.py所在的文件夹下找到保存下来的新图像。下面有两个新图像的示例。
目标检测前:
图片来源:alzheimers.co.uk
图片来源:Wikicommons
目标检测后:
在Spyder编译器中运行结果如下所示:
输出的目标检测精度结果:
person : 57.20391869544983
person : 52.57977843284607
person : 70.81094980239868
person : 76.99859142303467
person : 79.40077781677246
bicycle : 81.0384213924408
person : 83.66722464561462
person : 89.41188454627991
truck : 60.61040759086609
person : 69.65749859809875
bus : 97.92424440383911
truck : 83.94358158111572
car : 72.50492572784424
在Spyder编译器中运行结果如下所示:
输出的目标检测精度结果:
person : 62.45866417884827
person : 58.67737531661987
person : 69.44932341575623
person : 71.84218168258667
person : 59.53381657600403
person : 54.65759038925171
motorcycle : 65.84504842758179
bus : 99.40318465232849
car : 72.41445779800415
person : 58.32530856132507
person : 54.449981451034546
person : 80.11815547943115
person : 74.30745959281921
person : 77.78302431106567
person : 71.15439772605896
bicycle : 69.92427110671997
person : 66.17957353591919
bicycle : 90.50283432006836
motorcycle : 94.09030675888062
短短10行代码就出了目标检测的结果,这也太快了吧!本着对真理探索的热情,在弄懂里面的原理后,小编将在下文对每行代码进行解读。
知其然知其所以然:代码解读
下面来解释一下这10行代码的工作原理:
from imageai.Detection import ObjectDetectionimport osexecution_path = os.getcwd()
br
在以上3行代码中,在第一行导入了ImageAI的目标检测类;在第二行导入了Python的os类;在第三行中定义了一个变量,保存Python文件、RetinaNet模型文件以及图像所在文件夹的路径。
detector = ObjectDetection()detector.setModelTypeAsRetinaNet()detector.setModelPath( os.path.join(execution_path , "resnet50_coco_best_v2.0.1.h5"))detector.loadModel()detections = detector.detectObjectsFromImage(input_image=os.path.join(execution_path , "image.jpg"), output_image_path=os.path.join(execution_path , "imagenew.jpg"))
br
在以上5行代码中,我们在第一行中定义了一个目标检测类的实例;在第二行中将实例的模型类型设定为RetinaNet;在第三行中将模型路径设置为RetinaNet模型的路径;在第四行中将模型加载到目标检测类的实例中;在第五行中调用检测函数,并将文件输入输出路径作为参数传入。
for eachObject in detections: print(eachObject["name"] , " : " , eachObject["percentage_probability"] )
br
在以上两行代码中,第一行用来对detector.detectObjectsFromImage 函数返回的所有结果进行迭代,第二行用来输出图片中检测到的每个目标的名字及其概率。
自定义目标检测
除此外,ImageAI也支持强大的自定义目标检测。其中之一是能够提取图像中检测到的每个物体。只需要将参数
extract_detected_objects=True
br
传入
detectObjectsFromImage
br
函数中,如下所示,目标检测类将为图像对象创建一个文件夹,提取每个图像,将每个子图像保存到创建的新文件夹中,并返回一个包含每个图像路径的数组。
detections, extracted_images = detector.detectObjectsFromImage(input_image=os.path.join(execution_path , "image.jpg"), output_image_path=os.path.join(execution_path , "imagenew.jpg"), extract_detected_objects=True)
br
将其应用到第一张图片上,得到如下结果:
所有行人都被很好地提取了出来,为了节约空间这里只显示了一部分。
ImageAI的其他功能
ImageAI提供了许多功能,可用于目标检测任务的自定义和部署。其支持的功能包括:
调整最小概率:默认情况下,概率小于50%的物体不会显示。对于需要高精度的情况,可以增加此值;对于需要检测所有可能对象的情况,可以减少此值。
自定义目标检测:通过提供的CustomObject类,可以使检测类检测一个或几个特定目标。
检测速度:通过将检测速度设置为“fast”、“faster”或“fastest”,可以减少检测图像所需的时间。
输入类型:可指定并解析图像的文件路径,以Numpy数组或图像文件流作为输入
输出类型:可指定detectObjectsFromImage函数以文件或Numpy数组的形式返回图像
你可以在上文给出的官方GitHub链接中找到如何使用上述功能以及ImageAI中包含的其他计算机视觉功能的详细信息和文档。
相关报道:
https://towardsdatascience.com/object-detection-with-10-lines-of-code-d6cb4d86f606
编辑:王菁
校对:龚力
10行代码带你搞定目标检测(附代码)相关推荐
- 【目标检测】基于yolov5海上船舶目标检测(附代码和数据集)
Hello,大家好,我是augustqi.今天给大家分享的目标检测项目是:基于yolov5海上船舶目标检测(附代码和数据集) Part1 前言 传统的海上目标检测是通过雷达来实现,但是随着技术的发展, ...
- python包裹和运费_这个Python库真的太好用了,10行代码就能轻松搞定目标检测
目标检测是指计算机和软件系统对图像或场景中的目标进行定位和识别的任务. 目标检测已广泛应用于人脸检测.车辆检测.人流量统计.网络图像.安防系统和无人驾驶等多个领域. 早期目标检测的实现基于经典算法,比 ...
- 10行Python代码搞定目标检测
from imageai.Detection import ObjectDetection #导入了 ImageAI 目标检测类 import os execution_path = os.getcw ...
- 火爆全网络!这个GitHub项目开源了!搞定目标检测、图像识别
什么?有项目居然同时提供图像分类.图像识别.目标检测.语义分割.实例分割等几乎所有CV能力,还覆盖工业制造.安防巡检.能源电力.卫星遥感.智能交通等十多个行业.千亿美金价值AI应用场景,而且简单到只要 ...
- ECCV2022|何恺明团队开源ViTDet:只用普通ViT,不做分层设计也能搞定目标检测...
点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者丨张倩.小舟 来源丨机器之心 编辑丨极市平台 导读 做目标检测就 ...
- ECCV2022|何恺明团队开源ViTDet:只用普通ViT,不做分层设计也能搞定目标检测
导学 该文章证明了将普通的.非分层的视觉 Transformer 作为主干网络进行目标检测的可行性. 研究概述 论文链接:https://arxiv.org/abs/2203.16527 代码(已开源 ...
- 何恺明团队新作:只用普通ViT,不做分层设计也能搞定目标检测
点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 鱼羊 发自 凹非寺 量子位 | 公众号 QbitAI 微软的Swin ...
- 一行命令搞定图像质量评价 | 附代码和操作步骤
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 在交流群里,经常有人问到图像质量评价的问题.比如对监控摄像头拍摄的 ...
- 10行代码让你轻松搞定对象检测
摘要: 十行代码轻松搞定对象检测?快来看看如何使用ImageAI. 计算机视觉是人工智能领域中最重要的一个分支.计算机视觉是一门能够识别和理解图像及其场景的计算机软件系统的科学.计算机视觉包括图像识 ...
最新文章
- python爬取网易云音乐_Python 从零开始爬虫(七)——实战:网易云音乐评论爬取(附加密算法)...
- 计算机毕业优秀作品展观后感,信息学院毕业设计作品展观后感
- 为什么Java进程使用的RAM比Heap Size大?
- java项目中使用的jar包出错怎么办
- C#类与结构体究竟谁快——各种函数调用模式速度评测
- react全局状态管理_react状态管理redux
- Andoid自动判断输入是电话,网址或者Email的方法----Linkify的应用!
- python控制窗口_Python : Turtle窗口控制
- 使用角色管理工具 安装或配置microsoft.net framework 3.5 sp1
- delphi 分析抓取html,delphi网页数据抓取
- http的ssl证书保姆级配置安装-多域名 免费ssl证书 解析 nginx配置
- matlab小波变换学习入门
- Python 命名规范
- IDEA 里 VersionController 中的 log 中的不同颜色含义
- 易语言MySQL静态编译,我说易语言静态编译太强大……
- hdf5 matlab,hdf5格式的matlab读写操作
- 【大数据处理技术】实验4
- python+opencv直方图均衡化
- MinGW到底是个什么ghost
- 存储器读写c语言程序,单片机IIC接口存储器AT24C04的读写和显示程序(详细注释)...