随着以深度学习为代表的人工智能技术的成熟,国内众多行业都在基于人工智能技术推进行业变革与创新,积极探寻有效、有价值的应用场景进行商业化落地,其中尤以安防行业表现最为活跃。如灾害监控、人流量监控、施工安全监控、吸烟检测、口罩检测等。

虽然深度学习发展取得了不错的成绩,但是在产业落地时仍然面临诸多问题:训练数据获取难、模型泛化能力差、性能或效率达不到生产要求等。为此,百度飞桨结合实际经验,选取了火灾烟雾检测、人流量统计、安全帽检测这3个经典的场景,提供了从数据准备、模型训练优化,到模型部署的全流程可复用方案,降低产业落地门槛。

听说文档和代码已经开源了,赶紧来围观:

https://github.com/PaddlePaddle/awesome-DeepLearning

接下来我们就一起看下这三个案例吧:

火灾烟雾检测

据统计,全国共接报火灾25.2万起,死亡1183人,受伤775人,直接财产损失40.09亿元。传统的火灾烟雾检测存在监管难度大、人员管理难、工地数量多且分散等问题。针对以上问题,我们与普宙科技针对城市和森林两大场景,基于开源数据集和自研数据集进行烟雾和火灾检测的合作研发。

为了让模型结果更具说服力,我们重新定义了评价指标:

1)图片级别的召回率:只要在有目标的图片上检测出目标(不论框的个数),该图片被认为召回。批量有目标图片中被召回图片所占的比例,即为图片级别的召回率。

2)图片级别的误检率:只要在无目标的图片上检测出目标(不论框的个数),该图片被认为误检。批量无目标图片中被误检图片所占的比例,即为图片级别的错误率。

本案例分别选用了单阶段检测模型YOLOV3、PPYOLOV1、PPYOLOV2进行实验。模型优化策略包括数据增强、可变形卷积、加入背景图片等,下表详细展示了不同实验结果(单卡NVIDIA Tesla V100下同):

注:

aug:RandomHorizontalFlip + RandomDistort + RandomCrop + RandomExpand+MixupImage

aug1:RandomResizeByShort + RandomHorizontalFlip

根据上述实验数据,我们的方案降低了错误率、提高了召回率。推荐使用backbone为ResNet101的PPYOLOV2模型,通过使用数据增强、加入背景图、COCO预训练、空间金字塔池化(SPP)等优化策略,实现96%召回率,2.2%的误检率。更多优化策略详解请关注我们的直播课。

将我们AI模型装入无人机,可以实现无人机森林智能巡检,及时发现火情。此外,借力AI也可以发现非法越境、贩毒等违法犯罪行为,便于及时取证调查。

人流量统计

在商场或火车站等人流量较大的公开场合,其管理者可能需要进行动态人流量统计来监控商场/火车站每天的客流量数。因为人员基数较大、流动性较高,通过人工来进行流量统计并不现实。针对该问题,本项目与上海音智达公司合作,智能高效地实现动态场景下的人流量统计。

本案例技术的实现采用目前精度和速度都表现很好的多目标跟踪算法FairMOT,全部实验结果如下表所示(单卡NVIDIA Tesla V100)。通过尝试不同的优化策略,更改优化器、损失函数、使用数据增强、增加可变形卷积(dcn)、开启跨卡同步batch normalization(syncbn)、使用指数移动平均(EMA)、更换主干网络等,模型的最高跟踪准确度(MOTA)达到71.7。更多优化策略细节可以关注我们的直播课程。

用户可以直接使用我们开源的高精度行人检测跟踪模型进行fine-tuning或完成其他任务,如静态场景下的人员计数任务,助力公开场合的人员管理工作。该技术方案还可以用于车流量统计、嫌疑人跟踪等更多任务场景中。更多场景将在直播中解锁~

安全帽检测

在施工现场,对于来往人员以及工作人员而言,安全问题至关重要。而安全帽更是保障施工现场在场人员安全的第一防线,因此需要对场地中的人员进行安全提醒。当人员未佩戴安全帽进入施工场所时,人为监管耗时耗力,而且不易实时监管,过程繁琐、消耗人力且实时性较差。

针对以上问题,上海天覆科技有限公司基于百度同学自研、工业界表现超高性价比的PP-YOLOV2模型进行实验,获得如下数据。

推荐使用backbone为ResNet50的PPYOLOV2模型,添加可变形卷积dcn、输入图像大小为608的情况下,安全帽ap高达96.83%,推理速度达到13.7fps。使用NV-Jetson进行部署,实现很好的检测效果。

为了让大家更加深入地了解这些案例,获取产业实现方案,百度高工将于10月26-28日围绕四大行业、八大真实场景亲授产业实践案例课,欢迎小伙伴们锁定我们的直播间!

扫码报名直播课,立即加入技术交流群

精彩内容抢先看

点击下方“阅读原文”也可报名:

火灾检测、人流量统计、安全帽检测,飞桨开源一键运行的产业案例教程相关推荐

  1. 基于PaddleDetection实现人流量统计人体检测

    人流量统计 1. 项目概述 在地铁站.火车站.机场.展馆.景区等公共场所,需要实时检测人流数量,当人流密度过高时及时预警,并实施导流.限流等措施,防止安全隐患. 在人流密度较高的公共场所,使用Padd ...

  2. 百度飞桨开源Open Images Dataset V5目标检测比赛最好单模型MSF-DET

    目标检测是计算机视觉领域中的核心任务.Open Images Dataset V5(OIDV5)是目前规模最大的目标检测公开数据集[1].基于飞桨(PaddlePaddle)的PaddleDetect ...

  3. 安全帽检测,工地安全帽检测源码

    安全帽检测,工地安全帽检测源码 可以识别是否带了安全帽,用于工地安全监测,保障工人安全. 代码基于yolo v4,训练了8000张左右图片(图片由网上爬取并打好标签),有数据集,包括图片及voc格式标 ...

  4. 凝聚406万开发者 飞桨十大发布提速产业智能化

    12月12日,由深度学习技术及应用国家工程实验室主办的WAVE SUMMIT+2021深度学习开发者峰会在上海召开.百度首席技术官.深度学习技术及应用国家工程实验室主任王海峰公布飞桨最新成绩单:凝聚4 ...

  5. 1.3 飞桨开源深度学习平台介绍

    介绍飞桨在行业内的应用情况.产品全景.技术优势,以及飞桨的安装方法和联系方式. 深度学习框架 近年来深度学习在很多机器学习领域都有着非常出色表现,在图像识别.语音识别.自然语言处理.机器人.网络广告投 ...

  6. 工业革命的秋之涟漪(二):从飞桨,走向深度学习产业实践

    在<工业革命的秋之涟漪>第一篇中,我们回顾了这样一系列问题:今天的中国为什么需要AI技术驱动的产业革命?又为何可以培育这场革命?在此基础上,我们讨论了深度学习框架的核心位置,以及百度如何让 ...

  7. 飞桨开源深度学习平台介绍

    深度学习框架 近年来深度学习在很多机器学习领域都有着非常出色的表现,在图像识别.语音识别.自然语言处理.机器人.网络广告投放.医学自动诊断和金融等领域有着广泛应用.面对繁多的应用场景,深度学习框架有助 ...

  8. 飞桨开源背后,AgentMaker的升级打怪之路

    点击左上方蓝字关注我们 据中国开源软件(OSS)推进联盟最新发布的<2021中国开源发展蓝皮书>显示,中国已经具备了全球最大的开发者群体,32%的中国开发者参与过开源项目,我国开源生态正在 ...

  9. 飞桨开源社区携手开源之夏,邀你一起走进2023开源季!

    飞桨于 2016 年正式开源,秉承开源开放的理念,建设了蓬勃发展的开源社区,汇聚了框架开发者.算法研究者.硬件开发者和应用开发者等各角色成员,各个角色在自运转的生态中参与开源共建,形成巨大的生态力量, ...

  10. 百度CTO王海峰服贸会展示AI新基建成果,飞桨获“科技创新服务示范案例”奖

    AI正在为各行各业注入新活力,而AI新基建也在为包括服务贸易领域在内的社会经济发展提供新动力.9月4日,万众瞩目的2020中国国际服务贸易交易会正式召开.这是疫情发生以来,我国在线下举办的第一场重大国 ...

最新文章

  1. 汇编语言串指令经典题目
  2. kubernetes 集群部署
  3. 爬取三千条数据需要多久_存储-性能,IOPS,带宽,吞吐量,1TB数据需要多久写完...
  4. windows服务器迁到_将文件服务器及域控制器从2003迁移至Windows Server 2008 R2
  5. 【计算机本科补全计划】Mysql 学习小计(1)
  6. BEGINNING SHAREPOINT#174; 2013 DEVELOPMENT 第1章节--SharePoint 2013 介绍 SharePoint 2013 平台...
  7. Vivaldi解决flash插件问题
  8. Java7 一些新特性及脚本语言支持API--笔记
  9. NB-IoT窄带物联网技术项目开发教程--技术简介(一)
  10. Vivado使用记录(二)下载与固化
  11. Could not find a package configuration file... GflagsConfig.cmake gflags-config.cmake 解决方法
  12. 预制包含很多lib库的apk
  13. vue-amap 高德地图中使用测距插件
  14. J2EE的13个标准(规范)
  15. c语言任伟,任 伟
  16. 服务器本地远程登录景安服务器,如何远程管理windows2003服务器
  17. 计网 | 【三 数据链路层】知识点及例题
  18. 设计一个形状类(接口)Shape
  19. CentOS7 搭建php环境
  20. 遁迹-如何找寻图像在styleGAN2对应的latent code潜向量

热门文章

  1. 汇编语言 跳转到第一行输出黑底白字
  2. String 尺取法
  3. VS2010启动总是遇到异常提示的解决
  4. 33. Avoid Hiding inerited names
  5. struts2之自定义拦截器及拦截器生命周期分析
  6. java去除 r_Android apk瘦身最佳实践(一):去除R.class
  7. c++游戏编程100事列_C/C++编程笔记:C语言开发经典游戏项目《五子棋》,内含源码...
  8. bilstmcrf词性标注_BiLSTM+CRF 的实现详解
  9. 子进程中获取父进程id_UNIX环境高级编程——进程控制
  10. (day 52 - 二叉搜索树) 剑指 Offer 68 - I. 二叉搜索树的最近公共祖先