点上方计算机视觉联盟获取更多干货

仅作学术分享,不代表本公众号立场,侵权联系删除

转载于:作者:Exposit

编译:ronghuaiyang  |  AI公园

AI博士笔记系列推荐

周志华《机器学习》手推笔记正式开源!可打印版本附pdf下载链接

导读

给出了目前目标检测中的一些问题和挑战。

几年前,在图像中寻找并分类单个物体是一项极其困难的任务。今天,在计算机视觉的帮助下,数字设备可以简单快速地识别图像的内容,这为不同领域的视觉数据理解和分析开辟了新的途径。

现在的物体检测的作用是什么?

具有目标检测的设备可以找到目标,在其周围画出矩形边界框,并确定每个被检测目标的类别。目标检测应用程序应用于许多不同的行业,包括零售、体育、医疗保健、营销、室内设计、农业、建筑、公共安全、交通等。

使用计算机视觉目标检测的一个很好的例子是足球学校系统,旨在提高训练分析和俱乐部内比赛的质量。该平台允许用户使用摄像头跟踪足球运动员和足球在球场上的运动,并使用收集到的数据创建个人训练计划。

尽管在这一领域取得了巨大的进展,计算机视觉的能力也很强,但目标检测是一个复杂的过程,其实现需要经历一定的挑战。

目标检测面临的挑战有哪些?

  • 视角的多样性

    物体检测的最大困难之一是,从不同的角度看一个物体可能看起来完全不同。例如,你可以在下面看到的蛋糕图片各不相同,因为它们从不同的侧面展示物体。因此,检测器的目标是从不同的角度来识别物体。

  • 变形

    计算机视觉分析的主题不仅是一个固体目标,而且还可以变形和改变其形状,这为目标检测提供了额外的复杂性。

看看足球运动员摆出不同姿势的图片。如果物体检测器被训练为只发现站立或奔跑的人,它可能无法发现躺在球场上或准备弯腰做动作的球员。

  • 遮挡

    有时,物体会被其他东西遮挡住,这使得人们很难辨认这些物体的标志。例如,在下面的第一张图片中,一个杯子被拿这个杯子的人的手盖住了。

在第二幅图中,一个人也拿着手机,手挡住了物体。这种情况增加了确定目标的困难。

  • 光照条件

    照明对物体的定义有很大的影响。相同的物体会因光照条件的不同而看起来不同。看看下面的图片:照亮的空间越少,物体就越不可见。所有这些因素都会影响检测器定义目标的能力。

  • 杂乱或有纹理的背景

    需要识别的物体可能会融入背景中,使其难以识别。例如,下图显示了很多物品,在识别剪刀或其他感兴趣的物品时,这些物品会造成干扰。在这种情况下,目标检测器将遇到检测问题。

  • 多样性

    同一个物体可能有完全不同的形状和大小。计算机视觉需要做大量的研究来阅读一个物体并理解它的含义。

上面所有的图片都描述了不同类型的房子。一个好的检测器应该检测这些目标,并将它们分配给同一个类。

  • 速度

    在视频方面,探测器需要经过训练,以便在不断变化的环境中进行分析。这意味着目标检测算法不仅必须准确地分类重要的目标,而且还必须在预测过程中具有令人难以置信的速度,以便能够识别运动中的目标。

-------------------

END

--------------------

我是王博Kings,985AI博士,华为云专家、CSDN博客专家(人工智能领域优质作者)。单个AI开源项目现在已经获得了2100+标星。现在在做AI相关内容,欢迎一起交流学习、生活各方面的问题,一起加油进步!

我们微信交流群涵盖以下方向(但并不局限于以下内容):人工智能,计算机视觉,自然语言处理,目标检测,语义分割,自动驾驶,GAN,强化学习,SLAM,人脸检测,最新算法,最新论文,OpenCV,TensorFlow,PyTorch,开源框架,学习方法...

这是我的私人微信,位置有限,一起进步!

王博的公众号,欢迎关注,干货多多

王博Kings的系列手推笔记(附高清PDF下载):

博士笔记 | 周志华《机器学习》手推笔记第一章思维导图

博士笔记 | 周志华《机器学习》手推笔记第二章“模型评估与选择”

博士笔记 | 周志华《机器学习》手推笔记第三章“线性模型”

博士笔记 | 周志华《机器学习》手推笔记第四章“决策树”

博士笔记 | 周志华《机器学习》手推笔记第五章“神经网络”

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(上)

博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(下)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(上)

博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(下)

博士笔记 | 周志华《机器学习》手推笔记第八章集成学习(上)

博士笔记 | 周志华《机器学习》手推笔记第八章集成学习(下)

博士笔记 | 周志华《机器学习》手推笔记第九章聚类

博士笔记 | 周志华《机器学习》手推笔记第十章降维与度量学习

博士笔记 | 周志华《机器学习》手推笔记第十一章稀疏学习

博士笔记 | 周志华《机器学习》手推笔记第十二章计算学习理论

博士笔记 | 周志华《机器学习》手推笔记第十三章半监督学习

博士笔记 | 周志华《机器学习》手推笔记第十四章概率图模型

点分享

点收藏

点点赞

点在看

计算机视觉物体检测中面对的挑战相关推荐

  1. 物体检测中的Objectness是什么?

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文转自AI公园 作者:Nathan Zhao 编译:ronghu ...

  2. 理解物体检测中的Objectness

    本文转自AI公园. 作者:Nathan Zhao 编译:ronghuaiyang 导读 在本文中,我们将讨论目标检测模型和Objectness的基础知识. 什么是物体检测模型? 物体检测模型本质上,正 ...

  3. 清华优博论文丨物体检测中的特征构建与模型优化

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 摘 要:本文针对物体检测中的环境变化多样.物体尺度变化不一.搜索空 ...

  4. 物体检测中的评价指标【文末赠书】

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 对于一个检测器,我们需要制定一定的规则来评价其好坏,从而选择需要的检测器.对于图像分类任务来讲,由于其 ...

  5. OpenImage冠军方案:在物体检测中为分类和回归任务使用各自独立的特征图

    点击上方"深度学习技术前沿",关注公众号,选择加"星标"或"置顶" 导读 这篇文章来自商汤科技,是OpenImage竞赛的冠军方案,本文对物 ...

  6. 【论文解读】Confluence:物体检测中不依赖IoU的NMS替代算法论文解析

    导读 基于IoU的NMS实际上是一种贪心算法,这种方法得到的结果往往不是最优的,Confluence给出了另一种选择. 论文地址:https://arxiv.org/abs/2012.00257 摘要 ...

  7. 物体检测中的困难样本挖掘(Online Hard Sample Mining)

    一.分类与检测 分类和检测是计算机视觉里面两个非常重要的任务,虽然两个任务的目标并不完全相同,但是本质上检测是在分类问题上的一次推广,即检测是在整个个图像上做的局部分类并且标记该局部分类的位置,那么可 ...

  8. 【CV】PAA论文解读:在物体检测中利用概率分布来将anchor分配为正负样本

    本文转自|AI公园 导读 又一篇anchor匹配策略的文章,不过确实是简单有效,在ATSS上只需要很小的修改就可以提升性能.GFL2在框的预测上用上了概率分布,这里又在anchor匹配上用上了概率分布 ...

  9. 【深度学习】解决物体检测中的小目标问题

    为了提高模型在小物体上的性能,我们建议使用以下技术: 提高图像捕获分辨率 提高模型的输入分辨率 平铺图像 通过扩充生成更多数据 自动学习模型锚 过滤掉多余的类 为什么小目标问题很难? 小物体问题困扰着 ...

最新文章

  1. CVPR2016:Improving Person Re-identification via Pose-aware Multi-shot Matching
  2. 肝!一个非常好用的 Python 魔法库
  3. 在MFC的picture控件中如何显示Mat图
  4. 学习前端开发,可提高Web开发效率的15类工具
  5. SVD奇异值分解(PCA,LSI)
  6. python 在线培训费用-线下python培训要多少钱?
  7. 安装java环境好_一键安装Java环境的好工具 你用了吗
  8. FPGA——按键消抖
  9. C#使用libVLC制作视频播放器时自定义鼠标事件的捕获或者忽略
  10. 阿里优酷视频分类方法???咋理解啊?
  11. SpringBoot2.x 集成 腾讯云短信
  12. 如何合并多个PDF文件并自动生成目录
  13. 《面试系列篇》——Java这些最基础的知识,你还记得多少?
  14. 迈成专转本三毛计算机,念念不忘,必有回响【迈成专转本学员分享】
  15. 剑指offe面试题8 旋转数组的最小数字 (java实现)
  16. android7 显示到pc,安卓手机上的画面怎么投屏到Win7电脑上?超详细投屏方法看这里!...
  17. 炼石喜获“2020中国网络安全产业联盟突出贡献单位奖”
  18. 华纳云:香港机房基础网络架构
  19. App Store 审核条款最新版--iOS审核被拒的原因都在这里了--苹果应用商店审核条款
  20. BZOJ5084: hashit

热门文章

  1. hmailserver php,hmailserver关于afterlogic webmail php版本下的用户密码修改功能
  2. python读取音频文件_python 读取wav 音频文件的两种方式
  3. 用java实现etcd分布式锁_etcd分布式锁及事务
  4. python测验9答案_【Python基础测试】你知道这些答案吗?
  5. python获取绝对路径的区别_python 获取路径不同方法的比较
  6. 【linux】Centos 8 安装 悟空CRM-11.0
  7. 中国计量大学c语言历年考试卷,语言程序设计试卷A中国计量学院.doc
  8. 计算机语言中字体的设置,font-style字体设置详解
  9. Vue Cli 3.x项目如何部署到IIS子站点下
  10. web前端最全各类资源