原标题:怎样在树莓派上轻松实现深度学习目标检测?

雷锋网按:本文为 AI 研习社编译的技术博客,原标题 How to easily Detect Objects with Deep Learning on Raspberry Pi,作者为 Sarthak Jain。

翻译 | 小哥哥 狒狒 校对 | 老赵 整理 | 凡江

这个现实世界造成了很多挑战,比如数据有限、只有微型的计算机硬件(像手机、树莓派)所造成的无法运行复杂深度学习模型等。这篇文章演示了如何使用树莓派来进行目标检测。就像路上行驶的汽车,冰箱里的橘子,文件上的签名和太空中的特斯拉。

免责声明:我正在建设 nanonets.com 来帮助使用很少的数据和没有计算机硬件的情况下构建机器学习模型。

如果你很迫切,请直接下拉到这篇文章的底部进入Github的仓库。

在孟买的公路上检测车辆

为什么是目标检测?为什么是树莓派?

树莓派是一款灵活的计算机硬件,它以1500万台的销量已经吸引了一代消费者的心,并且黑客们也在树莓派上构建了很多很酷的项目。考虑到深度学习和树莓派相机的的流行,我们认为如果能在树莓派上使用深度学习来检测任意的物体那就非常棒了。

现在你可以检测到你的自拍照里的照片炸弹,有人进入到Harambe的笼子里,哪里有辣椒酱或者亚马逊的快递员进入到你的房子里。

什么是目标检测?

2000万年的进化使得人类的视觉系统有了相当高的进化。人脑有30%的神经元负责处理视觉信息(相对比只有8%处理触觉和3%处理听觉)。与机器相比,人类有两个主要的优势。一是立体视觉,二是训练数据集的供应几乎是无限的(一个五岁的婴儿可以大约在30fps的采样间隔获得2.7B的图像数据)。

为了模仿人类水平的表现,科学家将视觉感知任务分解为四个不同的类别。

1. 分类,为图像指定一个标签。

2. 定位,对特定的标签指定一个边框。

3. 物体检测,在图像中绘制多个边框。

4. 图像分割,得到物体在图像中的精确位置区域。

物体检测对于很多应用已经足够好(图像分割是更精确的结果,它受到了创建训练数据复杂性的影响。相比于画边框它通常花费人类标注者12倍的时间去分割图像。)此外,在检测物体之后,可以将物体在边框中单独分割出来。

使用物体检测:

目标检测具有重要的现实意义,已经在各行各业得到了广泛应用。下面列举了一些例子:

我怎样使用物体检测解决自己的问题?

物体检测可以用于解决各种各样的问题。这些是一个概括的分类:

1. 物体是不是出现在我的图像中?比如在我的房子有一个入侵者。

2. 在图像中的一个物体在哪个位置?比如一个汽车试图在世界各地导航时,知道物体的位置就很重要。

3. 图像中有多少个物体?物体检测是计算物体数目最有效的方法之一。比如仓库的货架上有多少个盒子。

4. 图像中有哪些不同类型的物体?比如动物园的哪些区域有哪些动物?

5.物体的尺寸有多大?特别是使用静态的相机,很容易计算出物体的大小。比如芒果的大小是多少。

6. 物体之间是如何相互作用的?比如在足球场上的队形是如何影响比赛结果的?

7. 物体在不同时间的位置(跟踪一个物体)?比如跟踪一个像火车一样的物体并且计算它的速度。

在 20 行代码内完成物体检测

YOLO算法的可视化

有多种用于物体检测的模型或结构。每一个都在速度、尺寸和精确度之间权衡。我们选择了最流行的一个:YOLO(You only look once),并且展示它如何以20行代码(忽略注释)进行工作。

注意:这是伪代码,不是一个可直接工作的实例。它有一个非常标准的CNN构成的黑箱,如下图所示:

你可以阅读(YOLO)全文:https://pjreddie.com/media/files/papers/yolo_1.pdf

YOLO中使用卷积神经网络的体系结构代码小于20行,如下:

如何建立目标检测的深度学习模型?

深度学习的工作流程有6个基本步骤,分为了三个部分:

1. 收集训练集

2. 训练模型

3. 预测新图像

第1阶段 — 收集训练数据

步骤1. 收集图像(每个对象至少100张)

......

想要继续阅读,请移步至我们的AI研习社社区:http://www.gair.link/page/TextTranslation/904

更多精彩内容尽在 AI 研习社。

不同领域包括计算机视觉,语音语义,区块链,自动驾驶,数据挖掘,智能控制,编程语言等每日更新。

雷锋网(公众号:雷锋网)

基于 OpenCV(C++/Python) 使用深度学习 进行人类姿态检测

如何在 Azure 上使用 Horovod 框架进行物体检测的分布式深度学习

基于 OpenCV 使用 YOLOv3 进行深度学习中的物体检测

亚马逊、谷歌、微软等各家公司人脸识别对比

斯坦福CS231n李飞飞计算机视觉经典课程(中英双语字幕+作业讲解+实战分享)

等你来译:

你能在 10 分钟之内解决人物检测的问题吗?

如何使用 OpenCV 编写基于 Node.js 命令行界面 和 神经网络模型的图像分类

深度学习来自监督的方法返回搜狐,查看更多

责任编辑:

姿态检测 树莓派_怎样在树莓派上轻松实现深度学习目标检测?相关推荐

  1. 【树莓派】:配置+SSH+VNC,实现深度学习目标检测

    1.查看树莓派IP地址: hostname -i 更新软件源和软件 # 更新软件源 sudo apt-get update # 更新软件 sudo apt-get upgrade 2.通信准备 打开串 ...

  2. 【读点论文】PP-PicoDet: A Better Real-Time Object Detector on Mobile Devices,一种可在边缘设备上部署的深度学习目标检测

    PP-PicoDet: A Better Real-Time Object Detector on Mobile Devices https://github.com/ChanChiChoi/awes ...

  3. 深度学习目标检测指南:如何过滤不感兴趣的分类及添加新分类?

    编译 | 庞佳 责编 | Leo 出品 | AI 科技大本营(公众号ID:rgznai100) AI 科技大本营按:本文编译自 Adrian Rosebrock 发表在 PyImageSearch 上 ...

  4. cnn 句向量_深度学习目标检测Fast R-CNN论文解读

    前言 我们知道,R-CNN存在着以下几个问题: 分步骤进行,过程繁琐.Selective Search生成候选区域region proposal->fine tune预训练网络->针对每个 ...

  5. keras faster物体检测_全网 | 深度学习目标检测算法(精选12篇)

    太多的公众号每天的文章是否让你眼花缭乱?刷了好多文章,发现大都是转来转去?今天我在全网公众号里为大家精选主题为深度学习目标检测算法的文章12篇,其中包括综述,R-CNN,SPP-Net,Fast R- ...

  6. 【西安交大】2020年最新深度学习目标检测方法综述

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 目标检测的任务是从图像中精确且高效地识别.定位出大量预定义类别的物体实例.随着深度 ...

  7. 动手学深度学习——目标检测 SSD R-CNN Fast R-CNN Faster R-CNN Mask R-CNN

    来源:13.4. 锚框 - 动手学深度学习 2.0.0-beta1 documentation 目标检测:锚框算法原理与实现.SSD.R-CNN_神洛华的博客 目录 目标检测简介 目标检测模型 ​编辑 ...

  8. 深度学习目标检测 RCNN F-RCNN SPP yolo-v1 v2 v3 残差网络ResNet MobileNet SqueezeNet ShuffleNet

    深度学习目标检测--结构变化顺序是RCNN->SPP->Fast RCNN->Faster RCNN->YOLO->SSD->YOLO2->Mask RCNN ...

  9. 知识图谱在深度学习目标检测中的应用

    知识图谱是什么?深度学习的目标检测怎么和它相结合?我将带大家一起来解读其中奥秘--阿波,2020.4.16 检索摘要 写在前面 知识图谱 Abstract Introduction Base Dete ...

最新文章

  1. Fibonacci数列 矩阵快速幂
  2. Android下Activity的生命周期
  3. ANSI,ASCII,Unicode的区别与联系!
  4. C#黔驴技巧之去重(Distinct)
  5. ajax后台怎么取mapp,后台管理实现
  6. ecshop程序设置伪静态简单三步骤
  7. mac系统,鼠标移动太慢
  8. 【ES11(2020)】全局属性 globalThis
  9. 重温CLR(八 ) 泛型
  10. 全能直播王pc版_企鹅游戏直播助手v2.28.330.8-企鹅游戏直播助手PC版下载
  11. J2ME程序员容易遇到的问题!不断更新中_2008.05.17
  12. python学习之面向对象学习进阶
  13. iOS开发:remove reference与move to trash的区别
  14. 《我也能做CTO之程序员职业规划》之十五:智商
  15. sqlplus操作命令
  16. 驳《驳〈论OIer谈恋爱的必要性〉》
  17. 量子计算机需要的物理知识,量子计算机和物理学上的量子力学关系大吗?
  18. Android客户端与服务器端socket通讯
  19. 从汇编角度看一个C函数调用
  20. 如何看待2022届秋招嵌入式开发岗位薪资大涨?

热门文章

  1. C4D灯光照明技术学习教程
  2. 设计模式 之美 -- 策略模式
  3. Rocksdb 与 TitanDb 原理分析 及 性能对比测试
  4. Kubernetes 架构(下)【转】
  5. 使用rest_framework写api接口的一些注意事项(axios发送ajax请求)
  6. 12-09关于几种排序方式
  7. spring mvc 控制器方法传递一些经验对象的数组
  8. git - 简易指南
  9. WPF关闭应用程序,释放Window窗口资源方法
  10. Linux操作系统中内存buffer和cache的区别