本文由机器之心发布,作者:机器之心编辑部。

2018 年 6 月 28 日,由电子自动化设计顶级会议 DAC' 2018 主办的「低功耗目标检测系统设计挑战赛」于加州旧金山于落下帷幕。来自中科院计算所的 ICT-CAS 团队和来自清华大学的 TGIIF 团队在全球 114 支参赛队伍中脱颖而出,分获 GPU 组和 FPGA 组的冠军。本届比赛旨在为无人机设计高精度且高能效的物体检测系统,以满足实际复杂场景的需要。比赛任务极具挑战性,参赛设计需要考虑小物体及被遮蔽物体检测,需要区分同场景多个相似目标,也需要考虑检测速度及功耗等多方面因素。参赛队伍来自清华大学、北京大学、中科院、UIUC、CMU、IBM、Cadence 等全球多个优秀科研机构。

无人机在工业、农业、军事及消费级市场均有如土地测绘、巡检监测、物资配送、灾后救援等重要作用。其中,实现高精度且高能效物体检测是开展所有无人机任务的基本要素,也是本领域急需提高的方向。由于航拍数据集(无人机视角)的缺失,进一步提升无人机物体检测系统变得更加困难。

在这样的背景下,圣母大学的史弋宇教授,匹兹堡大学的胡京通教授,香港城市大学的余备教授和 Cognite Ventures 公司的 CEO Christopher Rowen 发起「低功耗目标检测系统设计挑战赛」,并在 DAC' 2018 成功举办。该比赛由 Nvidia、Xilinx 和 DJI 大疆创新赞助,由圣母大学博士后徐小维和匹兹堡大学博士生张鑫燚进行评测。Nvidia 和 Xilinx 分别为 GPU 和 FPGA 组的参赛队伍提供免费的嵌入式计算设备 TX2 GPU 和 PYNQ Z-1 FPGA。大疆创新为比赛提供了高达 150k 份由无人机在实际环境中采集的数据并提供了准确标注。

比赛中使用到的两种硬件平台: TX2 GPU(左)和 PYNQ Z-1 FPGA(右)

比赛从 2017 年 10 月 16 日正式开始,于 2018 年 5 月 28 日结束,共吸引 114 支来自全球多个科研机构的队伍参加。其中,53 支队伍参与 GPU 组比赛,61 支队伍参与 FPGA 组比赛。最终,两个组别前三名的队伍将被邀请至旧金山,在 DAC' 2018 上接受颁奖。同时,获奖队伍将能在大会上分享他们的设计并进行现场展示。

挑战 1: 小物体及遮蔽物检测

由于所有图片均在无人机视角下拍摄,大量图片中的待检测物体都非常小,且有很大的概率被树木和建筑物遮挡。这些物体本身的特征在如此小的尺度下会大大提升检测的难度。

小物体检测:绿色框对应行驶中的汽车为检测目标

挑战 2: 同一物体检测

与传统的物体检测不一样,本次比赛需要参赛队伍检测同一个物体。在无人机跟随应用中,无人机需要准确地检测出指定物体(如无人机操控者、车辆、动物等)并进行跟随飞行。当场景出现多个相似物体时,无人机也不能跟丢或跟错对象。此应用给物体检测带来了新的挑战。

特定行人检测:绿色框对应的是正确的检测目标,蓝色和红色狂均对应错误的行人。

挑战 3:高精度 vs 低功耗

比赛采用的评价指标是精度,速度和能耗的结合(评分细则详见 1)。考虑到 GPU 组及 FPGA 组使用了不同的计算能力硬件设备,比赛对检测速度提出了不同的要求。其中 GPU 设计需运行至 20 FPS,FPGA 设计需达到 5 FPS。

GPU 组前三强

GPU 组的前三名分别是中科院计算所的 ICT-CAS 团队,浙江大学的 DeepZ 团队和山东大学的 SDU-Legend 团队。三个队伍均采用了深度学习完成比赛,也都采用 Yolo 神经网络作为他们的基础设计。

GPU 组第一名: ICT-CAS

ICT-CAS 团队使用了 feature extractor, tucker decomposition and precision scaling 相关技术。在每一种具体的方案中尝试了多种技术记忆组合以减少计算和内存消耗。在计算中采用了半精度(16bits)进行计算并使用 TensorRT 来提高计算速度。

GPU 组第二名: DeepZ

DeepZ 团队使用 Yolo-v2 作为骨干网络进行特征提取和检测。为了应对较小物体检测的问题,该团队使用了 Feature Pyramid Network 来获得上下文相关的特征。同时,focal loss function 的引入来缓解单一物体检测与多个候选框的不平衡问题。该团队 对 Yolo-v2 网络进行了一定的改进,改进后的网络结构如下图所示。

GPU 组第三名: SDU-Legend

SDU-Legend 团队基于 Yolo v-2 进行优化。首先,该团队将 Yolo v-2 网络由 32 层删减为 27 层。其次,为了满足检测小目标的要求,该团队降低了下采样率。在体系层次,该团队也做了一些优化:将网络最后两层的计算放在 CPU 上进行。该团队实现了 16bits 的半精度计算来进一步提升计算速度。

FPGA 组前三强

FPGA 组的冠军是来自清华大学的 TGIIF 团队,亚军是苏黎世联邦理工大学的 SystemsETHZ,季军来自 UIUC 的 iSmart2 团队。这三支参赛队伍分别在 FPGA 上部署了 SSD,SqueezeNet 和 MobileNet 神经网络,完成了比赛要求的物体检测任务。

FPGA 组第一名: TGIIF

TGIIF 团队在采用了深鉴科技的硬件加速器架构 DPU、全栈式工具链 DNNDK 和深度压缩技术的基础上,从算法、软件和硬件对整个目标检测系统进行了全栈式的协同优化。通过采用硬件友好的 SSD 网络和多线程优化技术,结合深度压缩和定点训练,在保证识别精度的前提下,满足了低功耗和实时性的要求。

FPGA 组第二名: SystemsETHZ

SystemsETHZ 团队使用低量化网络进行物体检测。特别的该团队采用 squeezenet 为基础进行设计,并将网络层数修改为 18 层。在具体的实现中,该团队采用了 folded computing 的方式来配置多路复用器和多路输出选择器进而实现神经网络不同阶段的计算。该团队使用一个 DMA 引擎实现 CPU 和 FPGA 间的数据传输。

FPGA 组第三名: iSmart2

iSmart2 组采用以 Mobilenet 为基础的轻量化网络设计,共 12 层。网络包含 depth-wise 3x3 卷积层,传统 1x1 卷积层和 max pooling 层,并采用简化的 Yolo 后端进行物体检测。在硬件实现上,该团队采用基于模块(IP)复用的结构,让相同种类的网络层复用同一个模块以节约硬件资源。此外,该团队将每层特征图分割成大小相同的数据块,以数据块为单位进行计算,实现了数据块之间的细粒度流水线结构,以缩短图片的处理延时。

DAC 2018目标检测系统挑战赛落幕:中科院清华分获GPU与FPGA冠军(解决小物体检测的问题)相关推荐

  1. anchor base和anchor free, 小物体检测, YOLO V1-3 9000 V4 V5 的区别,yolov5-8, yolox创新点

    文章目录 Anchor base和Anchor Free的区别: 如何增强模型对小物体的检测效果 Yolo基本思想 不同版本的Yolo网络差异 YOLO V1 YOLO V2 YOLO9000 YOL ...

  2. SSD针对小物体检测效果不好的现象的思考

    SSD针对小物体检测效果不好的现象的思考 最近在用ssd-caffe进行物体检测,但是在使用的过程中,发现ssd对小物体的检测效果很不好. 阅读了为什么SSD(Single Shot MultiBox ...

  3. rost反剽窃检测系统_色情、低俗信息没得治?今日头条这款检测工具,240万人都在用!...

    不同于色情信息,处理低俗信息的一个难点在于,人们对于低俗的判断标准具有一定的主观性. 刺猬公社 | 石灿 2月20日,今日头条方面宣布了"灵犬"全面升级的消息.除了反色情低俗,新版 ...

  4. ibm db2获取目标时间与当前时间的差值_高帧频视觉实时目标检测系统

    基于机器视觉的智能目标检测系统应用非常广泛,尤其在航天军工等领域中,经常涉及高速目标的实时检测和控制,对目标检测的智能性和实时性提出了更严格的要求.在这种应用中,视觉系统相对雷达.声纳具有信息量大.抗 ...

  5. ibm db2获取目标时间与当前时间的差值_【学术论文】高帧频视觉实时目标检测系统...

    摘要 为了实现高速场景下的智能实时目标检测,设计了一种基于ZYNQ7000系列FPGA的高速相机平台,并利用该平台进行目标检测算法实现,形成了一套高帧频实时目标检测系统样机. 该系统将高速CMOS图像 ...

  6. 基于YOLOv5的目标检测系统详解(附MATLAB GUI版代码)

    摘要:本文重点介绍了基于YOLOv5目标检测系统的MATLAB实现,用于智能检测物体种类并记录和保存结果,对各种物体检测结果可视化,提高目标识别的便捷性和准确性.本文详细阐述了目标检测系统的原理,并给 ...

  7. 在RHEL5下构建Nessus漏洞检测系统

    Nessus是目前比较流行的网络漏洞扫描与分析工具,由美国的Tenable Network Security,Inc公司出品.本文将介绍如何在RHEL5下搭建Nessus漏洞检测系统,以提高企业网络的 ...

  8. 【FaceRevelio】一种用于智能手机的带有前置摄像头的 人脸活跃度检测系统

    一些许写在前面的无厘头 刚入CS看无线传感的实验确实一头雾水(其实是没时间看这些边缘知识emmmm),但期末老师很有想法的给我们来了一次英文文献训练做大作业,有点不是那么废柴了哈哈哈. 虽然也是很拉, ...

  9. http拨测是什么意思_网络性能拨测-网络传输速度体验检测系统有哪些指标?

    原标题:网络性能拨测-网络传输速度体验检测系统有哪些指标? 网络性能拨测是对网络情况检测中用到的,用一些特定的网络数据指标来反映不同时间和地区用户使用网络的情况,可以协助网络提供商更好地了解用户的使用 ...

最新文章

  1. 【超详细】DBCP连接池配置参数说明
  2. pthread_join和pthread_detach详解
  3. java使用websocket前后端通信实现
  4. java isinterrupted_JAVA多线程之中断机制stop()、interrupted()、isInterrupted()
  5. 两台老机器,AMD K6-2和Intel C366
  6. ajax前端实时获取数据
  7. 禾川plc编程软件_HCP Works(禾川PLC编程工具)V2.26.01.92013 免费版
  8. vue+lodop打印快递面单
  9. vs201x下正则表达式过滤中文
  10. adobe acrobat pro dc 无法打开PDF_pdf怎样转成word格式
  11. N卡驱动安装闪退,安装程序无反应,重装无效,不重装系统解决方法
  12. VM虚拟机设置桥接模式
  13. Jupyter关联规则挖掘-莫名其妙的问题
  14. 用Excel自带图表插入带分类变量的箱形图(单坐标轴并列箱)
  15. Hoofball(B题)
  16. STM32 MPU 阅读笔记
  17. 手把手教你 合并分支到master上
  18. 记一次批量定时抓取微信公众号文章的实现
  19. tp5 对接腾讯云聊天
  20. C盘占用空间大如何清理

热门文章

  1. 企业信息安全很重要?私有化部署为企业信息保驾护航
  2. 野心外漏?Windows Defender或将独霸杀毒软件市场?
  3. 判断一个人靠不靠谱,就看这3点
  4. c语言喜羊羊,青青草原101C位之争,喜羊羊vs懒羊羊
  5. Vue.js函数的生命周期
  6. PW4203降压型1-3节锂电池充电芯片
  7. python-测试代码
  8. 要不要借钱给朋友和投资股票的共性
  9. 年产2万吨山楂酒工厂的设计-发酵工段及车间的设计(lunwen+任务书+cad图纸)
  10. CSS——景深perspective属性