从图像分类到3D姿势识别,计算机视觉领域涉及的技术应用非常广泛,而在工业应用领域最广泛,场景最丰富的就是目标检测技术。图像的分类、定位、分割等应用都离不开目标检测的前置动作。面部检测、人流统计、图像搜索引擎、卫星图像分析、仪表指针读取、识别害虫监控森林虫情都是目标检测在各行各业的落脚点。但就像很多其他的CV问题一样,目标检测缺乏一个显而易见的“做好”的方法。

而上周天,大雨倾盆的北京,百度PaddlePaddle与来自各行各业更多计算机视觉的从业者,对目标检测技术的行业应用来了一场深度解读。

任何工具的创造,都是为了回归应用。由PaddlePaddle团队举办的AI快车道聚焦在深度学习技术最广泛应用的技术主题,一期一会的技术干货现场,这次带来的是目标检测技术。

目标检测技术是什么

目标检测是对目标定位加目标分类的技术,即对图片中的可变数量的目标进行查找与分类。通过发展,目标检测主要发展出了两大阵营:单阶段和双阶段。常用的YOLO、SSD是单阶段的常见算法,18年百度在世界最权威的人脸检测公开评测集 WIDER FACE 的「Easy」、「Medium」和「Hard」三项评测子集中均荣膺榜首,刷新业内最好成绩的PyramidBox就是典型的双阶段算法。PaddlePaddle也有PyramidBox的经典模型。

目标检测的优化方向

目标检测的优化方向分为4要素:提取优质特征(包含主干网络优化,优化特征融合)、设计合理的Anchor、损失函数设计。

比如说在主干网络HRNET上的优化,通过全程保持高分辨率和对高低分辨率表征的多次信息交换来学到丰富的高分辨率表征,从而提高了检测的效果;基于HRNet的Faster RCNN在COCO数据集上有1%左右的提升。

在训练策略上也有很多优化tricks也在数据增强、模型设计、优化方式上做了分享。

图像业务中对遮挡、逆光、远近的tricks

现场也就苹果园采摘机器人做了案例解剖。在机械臂对苹果进行目标定位后采摘,经常会遇到很多树叶果子之间的遮挡、因为逆光颜色等带来的外观多变、还有远近不同的大小果子的差异,会大大的影响采摘精准度,造成漏摘、误摘等错误。那这中间的优化过程中,比如说对遮挡问题,Soft-NMS、Repulsion Loss、Aggregation Loss等解决遮挡问题就十分的适用。也可以通过Augmentation来增强数据集,包括随机变换颜色、形状、mixup等数据。通过FPN、重新设计的Anchor,利用实例分割Mask辅助检测对远近差异的果子更好的定位。

活动现场还分享了如无人结算机器前对区分颜色接近的食物与餐盘、对容器内部水平面的精准定位、对工业设备的仪表盘定位读取、在医学画面的画面清晰度的提升等等案例的拆解问答。

课堂现场还直接就北林的红脂大小蠹识别项目代码级的实验课程。目标检测算法分析、案例现场问答,业务难题经验分享、YOLO v3的实验课堂,合作硬件现场把玩,PaddlePaddle,深度“干货”。

现场的实验环节

PaddlePaddle核心框架、工具组件和服务平台

相信近期因为华为的一些被限制,大家对移动互联网时代的操作系统 “Android”还很记忆犹新,敲响了大家对国内自研的OS级别的技术高度关注。不论是手机、芯片、5G,还是工业上的一些技术专利,都是我们的近忧。百度高级副总裁王海峰曾如此概括:“深度学习框架承上启下,下接芯片、大型计算机系统,上承各种业务模型,行业应用。”而人工智能领域中的AI时代操作系统-深度学习框架扮演的就是这个更为立体的、革命性的操作系统。

以百度PaddlePaddle为例,作为国内唯一完整、全套的深度学习平台,PaddlePaddle包括核心框架、工具组件和服务平台三大部分。在核心框架层面,它可以提供开发、训练和预测一整套的技术能力;在此之上,又提供了包括视觉、自然语言等在内的丰富模型,形成完整的模型库,通过模块化的方式提供给使用者。除此以外,适应工业大生产阶段的“标准化、自动化和模块化”,PaddlePaddle还提供了包括迁移学习、强化学习、自动化网络结构设计、训练可视化工具、弹性深度学习计算等在内的工具组件。而在服务平台层面,PaddlePaddle则提供了零基础定制化训练和服务平台EasyDL和一站式开发平台AI Studio。这一整套的框架和服务,可以帮助广大开发者和企业利用工具化、平台化的方式,进一步降低深度学习应用门槛,加速推动产业智能化变革。

AI快车道-1000家企业深度学习技术应用扶持计划

为了全面推动AI技术需求的企业发展,PaddlePaddle面向企业开发者设立了AI快车道——企业深度学习实战营,是百度依托自身深厚的深度学习技术实践经验,面向有AI技术需求企业的算法工程师群体提供的快速应用扶持计划。

课程设计包含业务选型经验总结、案例剖析Know-How揭示、高性能开发融会贯通、AI行业落地专家坐诊。分为算法课程、经验课程、实验课程4个环节紧密相扣, 以及第一时间分享PaddlePaddle最新技术重点。

据了解,训练营致力于为1000家企业提供深度学习应用的快速落地,将在上海、深圳、杭州等城市多次举办,每月固定举办1-2次活动,并将在6个月后进行一次优秀企业落地项目展示的盛典,我们称之为“阅兵巡礼”。

课程的结束并不是ending,PaddlePaddle的GitHub一天24小时都有工作人员值班,为的就是方便开发者们。如果你也对PaddlePaddle感兴趣,赶快戳阅读原文,深度了解PaddlePaddle吧!

AI 快车道目标检测专场, PaddlePaddle “深度干货”相关推荐

  1. AI快车道Paddle Lite专场开讲!9月21日百度科技园见

    早上起床,睡眼朦胧之时,叫声"小度小度"便能唤醒家里的智能音箱,问问它现在几点,今天天气怎么样:出国在外,也不必精通各国语言,拿着百度共享Wi-Fi 翻译机就能畅行无阻.如今,越来 ...

  2. 全干货!百度AI快车道艾尼专场成都站开启报名

    成都市自年初出台<成都市加快人工智能产业发展推进方案(2019-2022年)>以来,便积极推动相关企业落地.强化人才培养并推进人工智能与传统行业融合应用,在AI赛道上不断"加速& ...

  3. Ai关于目标检测类算法比赛的经验总结

    内容来源于 宅码,作者Ai. 附一张作者签名--艾宏峰! 导读: 本文为作者自己参加的三个目标检测类算法比赛的经验总结,分为五个部分:数据研究和准备.参数调节.模型验证以及模型融合,作者还给出了一些关 ...

  4. 关于AI视觉——目标检测与物体分类(基于FZ5C)

    首先引入一个概念: 边缘计算:是指 在靠近物或数据源头的一侧,采用网络.计算.存储.应用核心能力为一体的开放平台,就近提供最近端服务.边缘计算处于物理实体和工业连接之间,或处于物理实体的顶端. 文章目 ...

  5. Yolo目标检测算法属于深度学习吗?yolo算法是什么?

    Yolo算法采用一个单独的CNN模型实现end-to-end的目标检测.本文将介绍一个端到端的方法--Yolo算法,该方法操作简便且仿真速度快,效果也不差. Yolo算法是什么? YOLO框架(You ...

  6. AI伪装目标检测:让变色龙现出原形!

    来源:极市平台 本文共3400字,建议阅读5分钟鉴于显著性目标和伪装目标研究的相似性,本文作者将显著性目标与伪装目标合在一起进行研究,文章重点是特征提取网络与特征融合技术,主要介绍了三种方法EGNet ...

  7. [AI开发]目标检测之素材标注

    算力和数据是影响深度学习应用效果的两个关键因素,在算力满足条件的情况下,为了到达更好的效果,我们需要将海量.高质量的素材数据喂给神经网络,训练出高精度的网络模型.吴恩达在深度学习公开课中提到,在算力满 ...

  8. 小目标检测:基于深度学习的小目标检测方法

    基于深度学习的小目标检测方法 小目标检测的难点:分辨率低.信息少,噪音多.图像模糊 解决方法:图像金字塔.特征金字塔.对包含小目标的图像进行oversampling.对小目标进行复制粘贴操作(不遮挡原 ...

  9. 旋转目标检测 校准的深度特征用于目标检测SSA

    目录 旋转目标检测rotation-yolov5 旋转目标检测综述 SSA旋转目标检测 旋转目标检测rotation-yolov5 旋转目标检测rotation-yolov5笔记_AI视觉网奇的博客- ...

最新文章

  1. R语言用户自定义函数的语法结构、编写自定义统计值计算函数(使用ifelse结构计算均值和标准差等)、编写自定义日期格式化(format)函数(switch函数使用不同分枝格式化日期数据)、应用自定函数
  2. 安全的开源Linux Kodachi 5.7 发布啦
  3. vlmcsd 编译与测试
  4. 关于Struts2的jsp页面的注释
  5. python好多模块和c相识_Python-Cext名称空间与常规Python子模块混合?
  6. Windows驱动开发VXD/WDM/WDF/DDK/WDK的联系和区别
  7. python调用cv2.findContours时报错:ValueError: not enough values to unpack (expected 3, got 2)
  8. python执行批处理文件_如何从Python中执行批处理文件,从而改变调用进程的环境?...
  9. POI读取单元格信息及单元格公式
  10. 三、Tableau筛选器的使用
  11. 极光推送 java 绑定别名_Android 极光推送设置别名
  12. js实现网页中元素缩放(zoom vs scale)
  13. Sparsified SGD with Memory 论文阅读
  14. 网站渗透思路(小白专看,大佬绕道)
  15. cpu顶盖怎么看步进_硬核科普丨什么是CPU步进?B0步进和U0步进具体差别有哪些...
  16. java ape切割_无损分解和保持依赖的判断
  17. 解决方案:Browserslist:caniuse-lite is outdated. Please run next command `npm update`
  18. FPS类游戏的逆向分析通用方法与C++逆向功能开发详解
  19. 【Vue3】第十四部分 父子组件传参
  20. 使用Mybatis进行更新操作成功,数据库却没更新的原因

热门文章

  1. [NVIDIA] Ububtu 获取 CUDA_ARCH
  2. 用tqdm可视化loop过程
  3. 记录——《C Primer Plus (第五版)》第九章编程练习第九题
  4. Flutter基础—第一个Flutter实例
  5. 中国酒精拭子市场趋势报告、技术动态创新及市场预测
  6. 中国开源视频编辑软件行业市场供需与战略研究报告
  7. 2021-2025年中国云计算数据中心IT资产处置(ITAD)行业市场供需与战略研究报告
  8. 车轮轴承行业调研报告 - 市场现状分析与发展前景预测(2021-2027年)
  9. install numpy for arm64
  10. “我的代码正在被千百万人使用”,MySQL 之父等六大国际数据库掌门人谈如何做数据库