点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

本文转自:磐创AI

【导读】目标检测技术是当今计算机视觉领域的发展趋势。在场景图像和视频中,有许多方法被用来检测物体。在资源和执行时间方面,每种技术都有自己的优势和局限性。检测视频中的物体也需要大量的技术知识和资源。

因此,人们一直在寻找一种简单、快速的目标检测方法。在本文中,我们将演示如何检测视频中看到的对象,只需5个步骤。

我们将在本任务中使用pixellib库,该库使用实例分割检测对象。我们还将使用预训练Mask R-CNN模型来识别视频中看到的物体。

在这个实现中,我们将检测交通视频中的车辆对象。

实例分割

实例分割是计算机视觉中的一种技术,它利用图像分割的方法进行目标检测。它在像素级识别图像或视频中存在的每个对象实例。

在图像分割中,视觉输入被分割成若干段,通过形成像素集合来表示对象或对象的一部分。实例分割识别图像中每个对象的每个实例,而不是像语义分割那样对每个像素进行分类。

Mask R-CNN

Mask R-CNN是由Kaiming He等人在Facebook人工智能研究所提出的深层神经网络的变体。该模型用于解决计算机视觉中的对象实例分割问题。

它检测图像中的对象,同时为每个实例生成一个高质量的分割掩码。它是Faster R-CNN的一个扩展,它增加了一个预测目标掩码的分支,与现有的边界盒识别分支并行。

下面给出了用于实例分割的Mask R-CNN框架。

实现

现在,我们将讨论在视频中检测物体的步骤。

1.安装库和依赖项

在第一步中,我们需要安装pixellib库及其依赖项。

!pip install pixellib

2.加载预先训练的Mask RCNN权重

由于我们将使用Mask R-CNN模型来检测目标,我们将下载其预训练的权重。

!wget --quiet https://github.com/matterport/Mask_RCNN/releases/download/v2.0/mask_rcnn_coco.h5

3.导入库

现在,我们将导入已安装的pixellib库。我们还将导入instance_segmentation 类,因为我们将使用实例分割方法检测对象。

import pixellib
from pixellib.instance import instance_segmentation

4.实例化实例分割模型并加载MASK R-CNN权重

在这一步中,我们将实例化pixellib提供的instance_segmentation类,并使用其预训练的权重加载Mask R-CNN模型。

segment_video = instance_segmentation()
segment_video.load_model("mask_rcnn_coco.h5")

5.检测物体

在这一步中,我们将通过在视频中MASK R-CNN来处理目标检测任务。我们会用随机使用一段交通视频

视频:https://analyticsindiamag.com/wp-content/uploads/2020/07/traffic_vid2.mp4?_=1

在这种方法中,我们设置每秒帧数,即视频输出每秒的帧数。

segment_video.process_video("traffic_vid2.mp4", show_bboxes = True, frames_per_second= 15, output_video_name="object_detect.mp4")

最后,我们将在工作目录中获得输出视频。这个过程的时间取决于视频的长度和大小。你应该使用GPU来加快处理速度。对于上面的交通视频,结果为

视频:https://analyticsindiamag.com/wp-content/uploads/2020/07/Object_Detect.mp4?_=2

你可以定义一个函数来从YouTube获取视频并将其直接传递给上面的函数。

因此,利用以上步骤,我们可以讨论一种非常简单的方法来实现视频中的目标检测任务。刚入门计算机视觉的可以用这种方法检测物体。

原文链接:https://analyticsindiamag.com/hands-on-guide-to-detect-objects-in-video-in-5-steps/

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

5个步骤实现目标检测相关推荐

  1. YOLO目标检测算法

    YOLO算法 简介 本文主要介绍YOLO算法,包括YOLOv1.YOLOv2/YOLO9000和YOLOv3.YOLO算法作为one-stage目标检测算法最典型的代表,其基于深度神经网络进行对象的识 ...

  2. R-CNN,Fast R-CNN,Faster R-CNN原理及执行与训练的实例+实现自己的目标检测(转)

    版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/m0_37407756/article/details/80810364 一.原理篇 R-CNN的原理 ...

  3. 目标检测 - 主流算法介绍 - 从RCNN到DETR

    目标检测是计算机视觉的一个非常重要的核心方向,它的主要任务目标定位和目标分类. 在深度学习介入该领域之前,传统的目标检测思路包括区域选择.手动特征提取.分类器分类.由于手动提取特征的方法往往很难满足目 ...

  4. 目标检测 -- R-CNN,Fast R-CNN,Faster R-CNN

    R-CNN,Fast R-CNN,Faster R-CNN这些是深度学习目标检测的鼻祖.看各种博客分析,东看看西看看,不系统.这里准备系统的记录一下深度学习目标检测的发展史.这里大部分摘录其他博客.参 ...

  5. 弱监督目标检测相关论文阅读笔记

    弱监督目标检测论文相关 1.传统目标检测 2014年之前->传统的目标检测器:VJ检测器->HOG检测器->DPM 2014年之后->基于深度学习的目标检测器: 双阶段:RCN ...

  6. 【目标检测实验系列】使用yolov3 spp训练西工大遥感数据集NWPU VHR-10(包括如何将NWPU VHR-10转为VOC格式和yolov3 spp实验调试的详细步骤,且附上训练完的权重文件)

    目录 1. 文章主要内容 2. 西工大数据集转换为VOC格式数据集 2.1 VOC数据集结构 2.2 西工大数据集 2.3 转换格式 2.3.1 构建与VOC类似的数据集文件结构(文件夹名可以自定义) ...

  7. MATLAB2018B下用Faster-RCNN做目标检测的训练和测试步骤

    近些年,随着深度学习在计算机视觉领域中的蓬勃发展.利用卷积神经网络对图像进行分类,以及对图像中目标进行识别定位成为比较前沿的技术.本文比较详尽的介绍了在MATLAB2018b环境下,利用Faster- ...

  8. 基于神经网络的目标检测论文之摘要:目标检测的步骤及优化策略

    摘 要 随着计算机性能的飞速提升,蛰伏已久的深度学习算法终于迎来了高速发展的时期.物体识别(也叫物体检测,目标检测)是计算机视觉领域中最有价值的研究方向之一.本论文主要研究的是卷积神经网络算法在一般场 ...

  9. keras_retinanet 目标检测——自定义图片数据集的模型训练步骤

    最近在学习 keras_retinanet ,下面就记录下用自己的数据集进行的模型训练. 大致分为以下几步: 自定义训练数据 图片目标标注 生成用于训练的图片名称.目标标注位置及目标类别的.csv文件 ...

最新文章

  1. android 监控app卸载,Android应用监听自身卸载
  2. App.Config详解
  3. [NOI2001]食物链
  4. Paxos算法是莱斯利·兰伯特(Leslie Lamport)1990年提出的一种基于消息传递的一致性算法。
  5. java 模式匹配_Java 14 模式匹配,非常赞的一个新特性!
  6. 空间解析几何中那些图形和方程(大彻大悟版)
  7. 韩式时尚大片《九月风》(出镜:马晓辉/徐嘉依)
  8. R语言循环函数编写三境界
  9. R5 4650G和R5 5600G差距
  10. 女人需谨记的十六条健康戒律
  11. URL中“#” “?” “”号的作用
  12. 【个人整理】一文看尽目标检测算法SSD的核心架构与设计思想
  13. 在cmd中进入mysql的步骤
  14. 蓝桥杯包子凑数java解析,蓝桥杯之包子凑数
  15. Linux下更改时间、时区
  16. java和js实现省市县级连
  17. 什么是模块化 ? 模块化的好处
  18. 手把手教你搭建入门级免费私有云盘NAS——基于syncthing——基础篇(树莓派、PC机)
  19. 【计算机网络】计算机网络疑难问题理解
  20. TPM2 工作原理及操作 -- API Doc(一)

热门文章

  1. RetinaFace,最强开源人脸检测算法
  2. 周礼栋:现在是计算机系统和网络研究“最好的时代”
  3. 北京智源人工智能研究院启动“智源学者计划”,与旷视发布首个智源联合实验室
  4. 程序员老在改Bug,就不能一次改好吗?
  5. 华为推CPU Turbo,荣耀Note10突破3000档
  6. 资源 | 盘点国外NLP领域40大高校及相关知名学者
  7. 程序员被辞 12 天,前领导要求回公司解释代码,结果懵了…
  8. redisTemplate分布式锁演变、redission分布式锁实现!
  9. 你说,一个Java字符串到底有多少个字符?
  10. 总结:被MySQL UTF8编码坑的惨痛教训...