从图像分类到3D姿势识别,计算机视觉领域涉及的技术应用非常广泛,而在工业应用领域最广泛,场景最丰富的就是目标检测技术。图像的分类、定位、分割等应用都离不开目标检测的前置动作。面部检测、人流统计、图像搜索引擎、卫星图像分析、仪表指针读取、识别害虫监控森林虫情都是目标检测在各行各业的落脚点。但就像很多其他的CV问题一样,目标检测缺乏一个显而易见的“做好”的方法。

而上周天,大雨倾盆的北京,百度PaddlePaddle与来自各行各业更多计算机视觉的从业者,对目标检测技术的行业应用来了一场深度解读。

任何工具的创造,都是为了回归应用。由PaddlePaddle团队举办的AI快车道聚焦在深度学习技术最广泛应用的技术主题,一期一会的技术干货现场,这次带来的是目标检测技术。

目标检测技术是什么

目标检测是对目标定位加目标分类的技术,即对图片中的可变数量的目标进行查找与分类。通过发展,目标检测主要发展出了两大阵营:单阶段和双阶段。常用的YOLO、SSD是单阶段的常见算法,18年百度在世界最权威的人脸检测公开评测集 WIDER FACE 的「Easy」、「Medium」和「Hard」三项评测子集中均荣膺榜首,刷新业内最好成绩的PyramidBox就是典型的双阶段算法。PaddlePaddle也有PyramidBox的经典模型。

目标检测的优化方向

目标检测的优化方向分为4要素:提取优质特征(包含主干网络优化,优化特征融合)、设计合理的Anchor、损失函数设计。

比如说在主干网络HRNET上的优化,通过全程保持高分辨率和对高低分辨率表征的多次信息交换来学到丰富的高分辨率表征,从而提高了检测的效果;基于HRNet的Faster RCNN在COCO数据集上有1%左右的提升。

在训练策略上也有很多优化tricks也在数据增强、模型设计、优化方式上做了分享。

图像业务中对遮挡、逆光、远近的tricks

现场也就苹果园采摘机器人做了案例解剖。在机械臂对苹果进行目标定位后采摘,经常会遇到很多树叶果子之间的遮挡、因为逆光颜色等带来的外观多变、还有远近不同的大小果子的差异,会大大的影响采摘精准度,造成漏摘、误摘等错误。那这中间的优化过程中,比如说对遮挡问题,Soft-NMS、Repulsion Loss、Aggregation Loss等解决遮挡问题就十分的适用。也可以通过Augmentation来增强数据集,包括随机变换颜色、形状、mixup等数据。通过FPN、重新设计的Anchor,利用实例分割Mask辅助检测对远近差异的果子更好的定位。

活动现场还分享了如无人结算机器前对区分颜色接近的食物与餐盘、对容器内部水平面的精准定位、对工业设备的仪表盘定位读取、在医学画面的画面清晰度的提升等等案例的拆解问答。

课堂现场还直接就北林的红脂大小蠹识别项目代码级的实验课程。目标检测算法分析、案例现场问答,业务难题经验分享、YOLO v3的实验课堂,合作硬件现场把玩,PaddlePaddle,深度“干货”。

现场的实验环节

PaddlePaddle核心框架、工具组件和服务平台

相信近期因为华为的一些被限制,大家对移动互联网时代的操作系统 “Android”还很记忆犹新,敲响了大家对国内自研的OS级别的技术高度关注。不论是手机、芯片、5G,还是工业上的一些技术专利,都是我们的近忧。百度高级副总裁王海峰曾如此概括:“深度学习框架承上启下,下接芯片、大型计算机系统,上承各种业务模型,行业应用。”而人工智能领域中的AI时代操作系统-深度学习框架扮演的就是这个更为立体的、革命性的操作系统。

以百度PaddlePaddle为例,作为国内唯一完整、全套的深度学习平台,PaddlePaddle包括核心框架、工具组件和服务平台三大部分。在核心框架层面,它可以提供开发、训练和预测一整套的技术能力;在此之上,又提供了包括视觉、自然语言等在内的丰富模型,形成完整的模型库,通过模块化的方式提供给使用者。除此以外,适应工业大生产阶段的“标准化、自动化和模块化”,PaddlePaddle还提供了包括迁移学习、强化学习、自动化网络结构设计、训练可视化工具、弹性深度学习计算等在内的工具组件。而在服务平台层面,PaddlePaddle则提供了零基础定制化训练和服务平台EasyDL和一站式开发平台AI Studio。这一整套的框架和服务,可以帮助广大开发者和企业利用工具化、平台化的方式,进一步降低深度学习应用门槛,加速推动产业智能化变革。

AI快车道-1000家企业深度学习技术应用扶持计划

为了全面推动AI技术需求的企业发展,PaddlePaddle面向企业开发者设立了AI快车道——企业深度学习实战营,是百度依托自身深厚的深度学习技术实践经验,面向有AI技术需求企业的算法工程师群体提供的快速应用扶持计划。

课程设计包含业务选型经验总结、案例剖析Know-How揭示、高性能开发融会贯通、AI行业落地专家坐诊。分为算法课程、经验课程、实验课程4个环节紧密相扣, 以及第一时间分享PaddlePaddle最新技术重点。

据了解,训练营致力于为1000家企业提供深度学习应用的快速落地,将在上海、深圳、杭州等城市多次举办,每月固定举办1-2次活动,并将在6个月后进行一次优秀企业落地项目展示的盛典,我们称之为“阅兵巡礼”。

课程的结束并不是ending,PaddlePaddle的GitHub一天24小时都有工作人员值班,为的就是方便开发者们。如果你也对PaddlePaddle感兴趣,赶快戳阅读原文,深度了解PaddlePaddle吧!

AI 快车道目标检测专场, PaddlePaddle “深度干货”相关推荐

  1. AI快车道Paddle Lite专场开讲!9月21日百度科技园见

    早上起床,睡眼朦胧之时,叫声"小度小度"便能唤醒家里的智能音箱,问问它现在几点,今天天气怎么样:出国在外,也不必精通各国语言,拿着百度共享Wi-Fi 翻译机就能畅行无阻.如今,越来 ...

  2. 全干货!百度AI快车道艾尼专场成都站开启报名

    成都市自年初出台<成都市加快人工智能产业发展推进方案(2019-2022年)>以来,便积极推动相关企业落地.强化人才培养并推进人工智能与传统行业融合应用,在AI赛道上不断"加速& ...

  3. Ai关于目标检测类算法比赛的经验总结

    内容来源于 宅码,作者Ai. 附一张作者签名--艾宏峰! 导读: 本文为作者自己参加的三个目标检测类算法比赛的经验总结,分为五个部分:数据研究和准备.参数调节.模型验证以及模型融合,作者还给出了一些关 ...

  4. 关于AI视觉——目标检测与物体分类(基于FZ5C)

    首先引入一个概念: 边缘计算:是指 在靠近物或数据源头的一侧,采用网络.计算.存储.应用核心能力为一体的开放平台,就近提供最近端服务.边缘计算处于物理实体和工业连接之间,或处于物理实体的顶端. 文章目 ...

  5. Yolo目标检测算法属于深度学习吗?yolo算法是什么?

    Yolo算法采用一个单独的CNN模型实现end-to-end的目标检测.本文将介绍一个端到端的方法--Yolo算法,该方法操作简便且仿真速度快,效果也不差. Yolo算法是什么? YOLO框架(You ...

  6. AI伪装目标检测:让变色龙现出原形!

    来源:极市平台 本文共3400字,建议阅读5分钟鉴于显著性目标和伪装目标研究的相似性,本文作者将显著性目标与伪装目标合在一起进行研究,文章重点是特征提取网络与特征融合技术,主要介绍了三种方法EGNet ...

  7. [AI开发]目标检测之素材标注

    算力和数据是影响深度学习应用效果的两个关键因素,在算力满足条件的情况下,为了到达更好的效果,我们需要将海量.高质量的素材数据喂给神经网络,训练出高精度的网络模型.吴恩达在深度学习公开课中提到,在算力满 ...

  8. 小目标检测:基于深度学习的小目标检测方法

    基于深度学习的小目标检测方法 小目标检测的难点:分辨率低.信息少,噪音多.图像模糊 解决方法:图像金字塔.特征金字塔.对包含小目标的图像进行oversampling.对小目标进行复制粘贴操作(不遮挡原 ...

  9. 旋转目标检测 校准的深度特征用于目标检测SSA

    目录 旋转目标检测rotation-yolov5 旋转目标检测综述 SSA旋转目标检测 旋转目标检测rotation-yolov5 旋转目标检测rotation-yolov5笔记_AI视觉网奇的博客- ...

最新文章

  1. 【UML 建模】UML建模语言入门 -- 用例视图详解 用例视图建模实战
  2. AtCoder AGC022E Median Replace (字符串、自动机、贪心、计数)
  3. maxvalue mysql自动分区_mysql的partition分区
  4. 百度Q3财报:净利润44亿元 重回增长轨道
  5. 态度决定你的人生高度(一个人能否成功,就看他的态度)
  6. mysql5.7.28升级到5.7.29_MySQL升级5.7.29
  7. Excel表格身份证号码如何一键提取性别、年龄、出生年月
  8. 英语六级翻译整理【未更新完】
  9. KU FPGA DDR4 SDRAM仿真/板卡测试
  10. 樊登读书分享ppt_樊登读书《干法》学习分享
  11. 禁用微信浏览器字体调整的方法
  12. Spring Boot (二)集成Mybatis、Druid
  13. SQL 实验项目5_触发器
  14. yolov2中的reorg网络层数据理解
  15. 让线程按顺序执行8种方法(转载)
  16. 物联网的发展需要五个阶段,具体是这样划分的
  17. 警惕诈骗:在俄罗斯000Pay声称支持…
  18. Java中private方法可以被重写吗?
  19. 好用的免费 PDF 密码删除工具有哪些?
  20. SQL 通配符及其使用

热门文章

  1. [tf] Unknown: Failed to get convolution algorithm. This is probably because cuDNN failed to initial
  2. 全国高校计算机能力挑战赛真题(二)
  3. python--笔记
  4. 运行github上的Vue项目
  5. 链表——单链表、单向循环链表、双向链表
  6. Flutter进阶—实现动画效果(九)
  7. 用Dart搭建HTTP服务器(1)
  8. Gulp,grunt,seajs/require和browserify/webpack的区别
  9. SQL vs NoSQL:异同比较
  10. Shell 的基础知识