• 下载数据-19.3 MB
  • 下载模型-43.5 MB
  • 下载结果-36.66 MB

在本系列的介绍性文章中,我们讨论了为边缘设备创建DL人员检测器的简单方法,该方法是找到合适的DNN模型并编写代码以在设备上启动它。在本文中,我们将讨论现有DNN方法的利弊,并选择一个经过预训练的模型以进行进一步的实验。

我们已经提到了三种用于图像中对象检测的现代DL技术: Faster-RCNN,单发检测器(SSD)和只看一次(YOLO)。为了选择最适合我们特定目的的技术,我们应该考虑每种技术的优缺点。

Faster-RCNN使用卷积神经网络以及“区域建议(Region-Proposal)”块和完全连接(FC)层。CNN是网络的第一块;它的工作是从图像中提取特征。接下来的块——区域建议网络——负责建议可能的对象位置的兴趣区域(ROI)。最后一个块——FC层——用于边界框(BB)回归和每个框的对象分类。这是Faster-RCNN算法的简单方案:

SSD方法类似于 Faster-RCNN。在CNN特征提取器之后,它包含一个Multi-Box检测器,该检测器允许在单个前向传递中进行边界框检测和对象分类。这就是为什么它被认为比Faster-RCNN更快。

YOLO技术是基于暗网(Darknet)框架。它无需在不同的位置和比例上扫描图像,而是将整个图像划分为一个单元格网格并分析每个单元格,从而对每个单元格属于某个类别的概率进行评分。这使得YOLO算法非常快。

仅考虑速度将使YOLO成为显而易见的选择。但是在做出决定之前,还有一件事要考虑——算法精度。用于对象检测的精度概念比用于对象分类的精度概念更为复杂。在这里,我们不仅必须评估分类误差,还必须评估对象边界框位置的误差。

物体检测的主要精确度是“交集相交”(IoU)——地面真值与检测到的边界盒的交点和并集比。因为我们可以找到许多类别来定位和分类,所以均值平均精度(mAP)用于计算整个数据集的精度。通常针对IoU = 0.5评估mAP值,并将其表示为“mAP@0.5”。

我们不会深入探讨物体检测精度的测量理论。我们仅以mAP@0.5来比较三种竞争的DL方法:该值越高,模型越精确。

在Internet上搜索各种Faster-RCNN,SSD和YOLO模型的精度值——您会发现很多截然不同的结果。这是因为每种检测方法都有许多预训练的DNN模型。例如,SSD技术可以使用不同的CNN模型进行特征提取,并且可以使用不同的数据集训练这些模型中的每一个:ImageNet,COCO,VOC等。

与所有现有模型的精度指标进行完整比较并不是我们的目标。我们使用相同的数据集对这三种方法进行了测试,结果表明,使用Faster-RCNN方法可以获得最佳的精度,使用SSD模型可以达到较低的精度,而使用YOLO网络则可以达到最低的精度。

看来,物体检测方法越快,其提供的精度就越低。因此,我们选择快乐的介质——SSD模型,该模型可以提供足够的速度和足够的精度。

接下来,我们寻找一种现成的SSD模型,该模型应为:

  1. 足够小,可以在有限的计算资源上在Raspberry Pi上运行
  2. 经过训练可以检测人(模型也可以检测其他类别的对象——但其人为检测准确性对我们正在创建的应用程序很重要)

我们找到了两种合适的SSD型号。第一个基于MobileNet CNN,第二个使用预训练的SqueezeNet作为特征提取器。两种模型都使用COCO数据集进行了训练,并且可以检测二十种不同类别的物体,包括人、汽车、狗和其他物体。每个型号的大小约为20 MB,与用于高性能处理器的型号的普通大小200-500 MB相比非常小。因此,这两个看起来像是实现我们目的的正确选择。

下一步

在接下来的文章中,我们将展示Python代码用于启动这些模型和图像中检测人类。

边缘设备上的实时AI人员检测:选择深度学习模型相关推荐

  1. 边缘设备上的实时AI人员检测:入门

    下载数据-19.3 MB 下载模型-43.5 MB 下载结果-36.66 MB 得益于深度学习(DL),实时视频流中的人的实时检测几年前就已经解决了.但是,在边缘和物联网设备上并不总是那么容易,因为它 ...

  2. 边缘设备上的实时AI人员检测:以实时模式检测视频中的人员

    下载数据-19.3 MB 下载模型-43.5 MB 下载结果-36.66 MB 这是七篇系列文章中的最后一篇.到目前为止,我们已经有了用于人员检测的DNN模型和用于在Raspberry Pi设备上启动 ...

  3. 边缘设备上的实时AI人员检测:检测视频中的人员

    下载数据-19.3 MB 下载模型-43.5 MB 下载结果-36.66 MB 从本系列的前几篇文章中,我们获得了使用SSD DNN模型检测图像中人物的Python代码.而且我们已经展示了该代码可以在 ...

  4. 边缘设备上的实时AI人员检测:在Raspberry Pi上启动SSD

    下载数据-19.3 MB 下载模型-43.5 MB 下载结果-36.66 MB 在本系列的最后一篇文章中,我们编写了Python代码,用于使用SSD模型检测图像中的人物.在本文中,我们将介绍在Rasp ...

  5. 边缘设备上的实时AI人员检测:在Raspberry Pi上测试SSD模型

    下载数据-19.3 MB 下载模型-43.5 MB 下载结果-36.66 MB 在本系列的上一篇文章中,我们已经在Raspberry Pi设备上启动了人体检测软件.在这一本文中,我们将比较Raspbe ...

  6. 边缘设备上的实时AI人员检测:使用预先训练的SSD模型检测人员

    下载数据-19.3 MB 下载模型-43.5 MB 下载结果-36.66 MB 在本系列的上一篇文章中,我们选择了两种SSD模型进行进一步工作,一种基于MobileNet,另一种基于SqueezeNe ...

  7. 边缘设备上的实时AI虫害消除:入门

    目录 介绍 选择器与检测器 实时性呢? 下一步 在这里,我们从使用AI和DNN的角度阐述了害虫消除的问题.然后,我们提出两种可能的解决方案:1--使用预训练的SSD模型检测猫.羊和其他动物:2--使用 ...

  8. 170 FPS!YolactEdge:边缘设备上的实时实例分割,已开源!

    点击上方"CVer",选择加"星标"置顶 重磅干货,第一时间送达 本文转载自:AI人工智能初学者 论文:https://arxiv.org/abs/2012.1 ...

  9. YolactEdge:边缘设备上的实时实例分割(Xavier: 30 FPS, RTX 2080 Ti:170 FPS)

    带有ResNet-101的YolactEdge在Jetson AGX Xavier上的速度高达30.8 FPS,在RTX 2080 Ti上的速度为172.7 FPS,AP性能超强!速度是目前主流方法的 ...

最新文章

  1. linux 解压所有以zip结尾的文件_在 Linux 上压缩文件:zip 命令的各种变体及用法...
  2. 绍中考能不能用计算机了,全国计算机二级考什么内容
  3. php从入门到放弃表情,Lite语言——从入门到放弃(一)
  4. MFC之CString与const char* string 转换
  5. 前端学习笔记day14 移动盒子 封装函数
  6. redisTemplate.keys异常
  7. 3脚送话器内部电路图_电话机维修送话电路故障
  8. 思岚S2激光雷达3—ROS node and test application for RPLIDAR
  9. 如何提高芝麻信用分?解读芝麻信用是怎么做的
  10. NVIDIA GPU显卡介绍
  11. Server-sent events(SSE) EventSource 客户端使用与服务器基础实现(基于Node.js)
  12. 小程序获取收货地址流程
  13. Python百度文库爬虫之doc文件
  14. vertica MySQL_Vertica数据库简介
  15. iOS 百度地图之坐标转换
  16. 职业学校的老师教计算机,职业院校计算机教学方式方法分析
  17. CS61-仅使用正则表达式匹配罗马数字|Python一对一学员答疑贴
  18. 国足历届世界杯对战图关系
  19. 机器视觉灯光选型指南
  20. 记录java围棋小游戏心得

热门文章

  1. 获取浏览器高度_鸡哥解读FILECOIN浏览器之幸运值
  2. 数据上报java_通过Jaeger上报Java应用数据
  3. 冬天人物活动插画|表达有温度的冬季海报必备psd分层素材
  4. 迁移python虚拟环境搭建_python虚拟环境virtualenv创建与迁移
  5. saas系统是什么_为什么SAAS食堂管理系统更受人们的欢迎?
  6. C语言中以二进制形式输出文件
  7. 为什么系统调用会消耗较多资源?系统调用的三种方法:软件中断(分析过程)、SYSCALL指令、vDSO(虚拟动态链接对象linux-vdso.so.1)
  8. 软件开源是如何赚钱?
  9. OpenAirInterface中的哈希表hashtable实现
  10. Open5GS:开源5G