人工智能中的图像处理

人工智能对于图像处理有不同的任务。在本文中,我将介绍目标检测和图像分割之间的区别。

在这两个任务中,我们都希望找到图像中某些感兴趣的项目的位置。例如,我们可以有一组安全摄像头照片,在每张照片上,我们想要识别照片中所有人的位置。

通常有两种方法可以用于此:目标检测(Object Detection)和图像分割(Image Segmentation)。

目标检测-预测包围盒

当我们说到物体检测时,我们通常会说到边界盒。这意味着我们的图像处理将在我们的图片中识别每个人周围的矩形。

边框通常由左上角的位置(2 个坐标)和宽度和高度(以像素为单位)定义。

来自开放图像数据集的注释图像。家庭堆雪人,来自 mwvchamber。在CC BY 2.0 许可下使用的图像。

如何理解目标检测方法?

如果我们回到任务:识别图片上的所有人,则可以理解通过边界框进行对象检测的逻辑。

我们首先想到的解决方案是将图像切成小块,然后在每个子图像上应用图像分类,以区别该图像是否是人类。 对单个图像进行分类是一项较容易的任务,并且是对象检测的一项,因此,他们采用了这种分步方法。

当前,YOLO模型(You Only Look Once)是解决此问题的伟大发明。 YOLO模型的开发人员已经构建了一个神经网络,该神经网络能够立即执行整个边界框方法!

当前用于目标检测的最佳模型

  • YOLO
  • Faster RCNN

图像分割-预测掩模

一步一步地扫描图像的逻辑替代方法是远离画框,而是逐像素地注释图像。

如果你这样做,你将会有一个更详细的模型,它基本上是输入图像的一个转换。

如何理解图像分割方法?

这个想法很基本:即使在扫描产品上的条形码时,也可以应用一种算法来转换输入信息(通过应用各种过滤器),这样,除了条形码序列以外的所有信息在最终图像中都不可见。


左图:https://commons.wikimedia.org/wiki/File:Image-segmentation-example.jpg。右图:https://commons.wikimedia.org/wiki/File:Image-segmentation-example-segmented.png。两个文件都支持 https://en.wikipedia.org/wiki/en:Creative_Commons

这是在图像上定位条形码的基本方法,但与在图像分割中所发生的情况类似。

图像分割的返回格式称为掩码:与原始图像大小相同的图像,但是对于每个像素,它只有一个布尔值来指示对象是否存在。

如果我们允许多个类别,它就会变得更加复杂:例如,它可以将一个海滩景观分为三类:空气、海洋和沙子。

当下图像分割的最佳模型

  • Mask RCNN
  • Unet
  • Segnet

比较总结

对象检测

  • 输入是一个矩阵(输入图像),每个像素有 3 个值(红、绿、蓝),如果是黑色和白色,则每个像素有 1 个值
  • 输出是由左上角和大小定义的边框列表

图像分割

  • 输入是一个矩阵(输入图像),每个像素有 3 个值(红、绿、蓝),如果是黑色和白色,则每个像素有 1 个值
  • 输出是一个矩阵(掩模图像),每个像素有一个包含指定类别的值

计算机视觉:图像检测和图像分割有什么区别?相关推荐

  1. 对象检测和图像分割有什么区别?

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 01.人工智能中的图像预处理 对象检测和图像分割是计算机视觉的两种 ...

  2. Dataset:数据集集合(CV方向数据集)-常见的计算机视觉图像数据集大集合包括表面缺陷检测数据集(持续更新)

    Dataset:数据集集合(CV方向数据集)-常见的计算机视觉图像数据集大集合包括表面缺陷检测数据集(建议收藏,持续更新) 目录 CV常用数据集平台集合 Mendeley Data CAISA-Web ...

  3. Dataset之CV:人工智能领域数据集集合(计算机视觉CV方向数据集)之常见的计算机视觉图像数据集大集合(包括表面缺陷检测数据集,持续更新)

    Dataset之CV:人工智能领域数据集集合(计算机视觉CV方向数据集)之常见的计算机视觉图像数据集大集合(包括表面缺陷检测数据集,持续更新) 目录 CV常用数据集平台集合 Mendeley Data ...

  4. 计算机视觉-深度学习图像检测方法梳理

    计算机视觉-深度学习图像检测方法梳理 由于之后要转方向啦,趁这段时间整理手中硕士研究方向的一些阅读笔记,这是一篇关于计算机视觉的基础知识梳理 先搞清一些小知识点 首先我们要弄清楚图像分类.目标定位.语 ...

  5. 计算机视觉——图像视觉显著性检测

    目录 系列文章目录 零.问题描述 一.图像显著性检测 1.定义 2.难点 二.常用评价标准和计算方法 1.综述 2.ROS曲线详述 2.1 混淆矩阵 2.2 ROC曲线简介 2.3 ROC曲线绘制及其 ...

  6. CV之IS:计算机视觉之图像分割(Image Segmentation)算法的挑战任务、算法演化、目标检测和图像分割(语义分割/实例分割/全景分割)的对比

    CV之IS:计算机视觉之图像分割(Image Segmentation)算法的挑战任务.算法演化.目标检测和图像分割(语义分割/实例分割/全景分割)的对比 相关文章 CV之IS:计算机视觉之图像分割( ...

  7. 深度学习(目标检测。图像分割等)图像标注工具汇总

    深度学习(目标检测.图像分割等)图像标注工具汇总 2018年05月31日 09:21:54 努力努力再努力tq 阅读数:3581 对于监督学习算法而言,数据决定了任务的上限,而算法只是在不断逼近这个上 ...

  8. 【图像检测】基于计算机视觉实现椭圆检测附matlab代码

    1 内容介绍 Hough变换在图像处理中占有重要地位,是一种检测曲线的有效方法.但使用传统的Hough变换来检测椭圆具有存储空间大计算时间长的缺点.为此提出了一种新的基于Hough变换的椭圆轮廓检测方 ...

  9. 计算机视觉图像基本处理--Harris角点检测

    文章目录 1.Harris角点检测基本思想 1.1基本思想 1.2 数学表达 2.简单代码实现 2.1 对于纹理平坦的图 2.1.1 正面图像 运行结果如下 结果分析 2.1.2 侧面图像 运行结果如 ...

最新文章

  1. Shell脚本中的并发
  2. 《ActionScript 3.0基础教程》——第2章 往舞台动态地添加对象2.1 创建库资源,并为它命名...
  3. 如何使用包含属性名称的变量检查对象属性是否存在?
  4. 面试:URI中的 “//” 有什么用?
  5. 技术解读|云上企业级存储——打开存储新维度,促进用户核心业务创新
  6. python兔子和獾_少儿编程分享:手把手教你用PYTHON编写兔獾大作战(三)
  7. Android【报错】. lang。android.app ClassCastException。SharedPreferencesImpl不能被强制转换为android.content.Shared
  8. JDK神坑:JAVA中Calendar的月份Month少1
  9. 树形dp-智慧树下你和我
  10. Topsis方法对数据综合评价
  11. opencv切割视频:把长视频切割成固定时间的短视频
  12. u-boot编译错误1:dtc: not found make
  13. Opencv之给图片加水印
  14. Android微信登录引起的内存泄漏
  15. winSCP 集成PuTTY附下载
  16. maven+ssm+redis配置demo
  17. 如何理解反射信号淹没在上升沿中
  18. 旺季到来,跨境电商卖家年末冲刺!
  19. 2021年除夕的html网页代码,2021年美观的春节倒计时代码
  20. IOS苹果开发者账号申请流程

热门文章

  1. python+opencv图像拼接-python opencv 图像拼接的实现方法
  2. iis6 php5.3 mysql_Win 2003下IIS6+Mysql+php5.2  isapi搭建 升级php5.2到5.3测试 借助fastcgi实现...
  3. python字符串转浮点数
  4. ip的正则表达式 java,项目实战:Java正则表达式验证IP地址
  5. 强强联合!智源x清华AIR,共启 AI 健康研究新篇章
  6. 《连线》| 李开复:新冠大流行将加速医疗AI革新
  7. 从粒子到宇宙的旅行指南
  8. 经常造轮子的 AI 工程师水平通常不会太差
  9. 面部特征点检测的关键技术
  10. 独家 | 攀登数据科学家和数据工程师之间的隔墙