作者:Surya Remanan,来源:AI公园

介绍

“如果没有数据分析,公司就会变得既盲又聋,就像高速公路上的鹿一样在网络上游荡。”

— Geoffrey Moore

每个数据科学任务都需要数据。具体地说,是输入系统的干净易懂的数据。说到图像,计算机需要看到人类眼睛看到的东西。

例如,人类有识别和分类物体的能力。同样,我们可以使用计算机视觉来解释它接收到的视觉数据。这就是图像标注的作用。

图像标注在计算机视觉中起着至关重要的作用。图像标注的目标是为和任务相关的、特定于任务的标签。这可能包括基于文本的标签(类),绘制在图像上的标签(即边框),甚至是像素级的标签。我们将在下面探讨这一系列不同的标注技术。

人工智能需要的人工干预比我们想象的要多。为了准备高精度的训练数据,我们必须对图像进行标注以得到正确的结果。数据注释通常需要较高水平的领域知识,只有来自特定领域的专家才能提供这些知识。

需要标注的计算机视觉任务:

  • 物体检测

  • 线/边缘检测

  • 分割

  • 姿态预测/关键点识别

  • 图像分类

1) 目标检测

进行目标检测的技术主要有两种,即2D和3D包围框。

对于多边形物体,可以使用多边形方法。让我们详细讨论一下。

2D 包围框

在这种方法中,只需要在被检测的物体周围绘制矩形框。它们用于定义对象在图像中的位置。边框可以由矩形左上角的x、y轴坐标和右下角的x、y轴坐标来确定。

优点和缺点:

  • 标注起来快速和容易。

  • 不能提供重要的信息,如物体的方向,这对许多应用来说是至关重要的。

  • 包括不属于物体一部分的背景像素。这可能会影响训练。

3D 包围框或者立方体

类似于2D边框,除了它们还可以显示目标的深度。这种标注是通过将二维图像平面上的边界框向后投影到三维长方体来实现的。它允许系统区分三维空间中的体积和位置等特征。

优点和缺点:

  • 解决了物体方向的问题。

  • 当物体被遮挡,这种标注可以想象包围框的维度,这可能会影响训练。

  • 这种标注也会包括背景像素,可能会影响训练。

多边形

有时,必须标记形状不规则的物体。在这种情况下,使用多边形。注释时只需标记物体的边缘,我们就能得到要检测的物体的完美轮廓。

优点和缺点:

  • 多边形标记的主要优点是它消除了背景像素,并捕获了物体的精确尺寸。

  • 非常耗时,如果物体的形状是复杂的,很难标注。

:多边形方法也用于物体形状的分割。我们将在下面讨论分割。

数据采集是ML冷启动的问题。但是,即使你有了一个可行的数据集,构建和测试模型也是需要技巧的。

2) 线/边缘检测(线和样条)

在划分边界时,线和样条是有用的。将区分一个区域和另一个区域的像素进行标注。

优点和缺点:

  • 这种方法的优点是,连线上的像素不需要都是连续的。这样在检测有中断的线或部分遮挡的物体是非常有用的。

  • 手动标注图像中的线是非常累人和费时的,特别是图像中有很多的线的时候。

  • 当物体碰巧是对齐的时候,可能会给出误导的结果。

3) 姿态预测 / 关键点识别

在许多计算机视觉应用中,神经网络常常需要识别输入图像中重要的感兴趣的点。我们把这些点称为地标或关键点。在这种应用中,我们希望神经网络输出关键点的坐标(x, y)。

4) 分割

图像分割是将一幅图像分割为多个部分的过程。图像分割通常用于在像素级定位图像中的物体和边界。图像分割方法有很多种。

  • 语义分割: 语义分割是一项机器学习任务,它需要像素级标注,其中图像中的每个像素都被分配给一个类。每个像素都带有语义意义。这主要用于环境背景非常重要的情况。

  • 实例分割: 实例分割是图像分割的一种子类型,它在像素级别上标识图像中每个物体的每个实例。实例分割和语义分割是图像分割的两种粒度级别之一。

  • 全景分割: 全景分割结合了语义分割和实例分割,所有像素都被分配一个类标签,所有目标实例都被唯一地分割。

5) 图像分类

图像分类不同于目标检测。目标检测的目的是识别和定位目标,而图像分类的目的是识别和识别特定的目标类。这个用例的一个常见示例是对猫和狗的图片进行分类。标注者必须为一只狗的图像分配一个类标签“dog”,对猫的图像分配类标签“cat”。

图像标注的用例

在本节中,我们将讨论如何使用图像标注来帮助机器模型执行特定行业的任务:

  • 零售: 2D边框可以用于标注产品的图像,然后机器学习算法可以使用这些图像来预测成本和其他属性。图像分类在这方面也有帮助。

  • 医学:多边形可用于在医用x射线中标记器官,以便将它们输入深度学习模型,以训练x射线中的畸形或缺陷。这是图像标注最重要的应用之一,需要医学专家具有较高的领域知识。

  • 自动驾驶汽车:这是另一个重要的领域,图像标注可以应用。利用语义分割对图像中的每个像素进行标记,使车辆能够感知到道路上的障碍物。这一领域的研究仍在进行中。

  • 情绪检测:这是里程碑,可以用来检测一个人的情绪(高兴,悲伤,或自然)。这可以应用于评估受试者对特定内容的情绪反应。

  • 制造行业:线和样条可用于标注工厂的图像线跟随机器人工作。这可以帮助自动化生产过程,人力劳动可以最小化。

图像标注的一些挑战

  • 时间复杂度:手工标注图像需要很多时间,机器学习需要大量的数据集,需要大量的时间来有效地标注这些基于图像的数据集。

  • 计算复杂度:机器学习需要精确标注的数据来运行模型。如果标注者在给图像做标注的时候,注入任何一种错误,都可能会影响到训练,所有的努力都可能付诸东流。

  • 领域知识:如前所述,图像标注通常需要特定领域的高级领域知识。因此,我们需要知道该标注什么的注解者,以及该领域的专家。

英文原文:https://heartbeat.fritz.ai/data-annotation-fundamentals-part-1-image-annotation-76f89ccf84f2

收藏 | 图像标注的基础内容介绍相关推荐

  1. 图像标注的基础内容介绍

    点击上方"AI公园",关注公众号,选择加"星标"或"置顶" 作者:Surya Remanan 编译:ronghuaiyang 导读 给大家介 ...

  2. folium基础内容介绍

    folium基础内容介绍 1. 简介 ​ folium是js上著名的地理信息可视化库leafet.js为Python提供的接口,通过它,我们可以通过在Python端编写代码操纵数据,来调用leafle ...

  3. 生动的SDN基础内容介绍(六)--SDN应用平面和网络测量

    生动的SDN基础内容介绍(六)--SDN应用平面和网络测量 背景 网络测量 网络测量的定义 网络测量的对象 网络状态参数 网络性能参数 网络流量参数 Heavy Hitter和Hierarchical ...

  4. 生动的SDN基础内容介绍(三)--Ryu控制器

    生动的SDN基础内容介绍(三)--Ryu控制器 控制器 Ryu的目录 Ryu的学习 simple_switch_13.py simple_switch_rest_13.py 交换机信息及流表项的查询 ...

  5. 生动的SDN基础内容介绍(五)--SDN北向协议/接口和意图驱动

    生动的SDN基础内容介绍(五)--SDN北向协议/接口和意图驱动 背景 北向协议 REST API REST API在Ryu中的实现 意图驱动 总结 背景 经过前几章的讲解,现在回过头来再看看SDN的 ...

  6. 生动的SDN基础内容介绍(二)--OpenFlow协议

    生动的SDN基础内容介绍(二)--OpenFlow协议 背景 OpenFlow OpenFlow的基础概念 流表项 流表 漏表 流表项的下发 流表项的删除 计量表 组表 控制器与交换机的通信 总结 背 ...

  7. 工赋开发者社区 | 当PLC与见“IT”:MES/MOM标准之ISA-95基础内容介绍

    ISA-95 简称S95,也有称作SP95.ISA-95 是企业系统与控制系统集成国际标准,由国际自动化学会(ISA,International Society of Automation) 在199 ...

  8. 收藏:NVMe协议基础原理介绍

    概述:NVM Express(NVMe),或称非易失性内存主机控制器接口规范(英语:Non Volatile Memory Host Controller Interface Specificatio ...

  9. 自制图像标注软件 —— 支持mask-rcnn等算法

    对于计算机视觉研究者来说,图像标注是一项基础但繁重的工作.有一个便捷好用的标注软件可以提高标注效率. 先灌水: 目前尝试了比较普遍的标注工具: (1)labelme 参考:https://blog.c ...

最新文章

  1. 声网sdk android接入,Android 集成声网Agora 音视频实时通话(三)
  2. 浅谈我的销售体会(一)
  3. TEG六周年 | 同心筑梦 共赢未来
  4. 《Internet 路由结构(第2版•修订版)》一7.5 常见问题
  5. 计算机诞生发展分类特点及应用,计算机的诞生与发展,及其特点
  6. python 嵌套型partials(nested partials)的使用
  7. java关键字:volatile
  8. 设计资源类的网站有哪些?
  9. windows server 2003 32位支持8G内存
  10. 后台json返回给ajax,Ajax 如何 得到后台返回 的json数据,正确的格式应该如何去写?...
  11. [转][Err] 1452 - Cannot add or update a child row: a foreign key constraint fail
  12. mysql 连接数和内存的关系_php-fpm进程数和mysql连接数之间的关系
  13. cadence的工艺角仿真、蒙特卡洛仿真、PSRR
  14. GHD官宣全新中国区焕发大使乔欣
  15. 新消费下的国货崛起新模式!
  16. 求以下表达式的值,写出您想到的一种或几种实现方法: 1-2+3-4+……+m
  17. windows插耳机没声音?
  18. win10笔记本亮度无法调整,亮度设置消失了
  19. 7、TM4单片机学习之串口功能
  20. java-net-php-python-jspm早教中心系统查重PPT计算机毕业设计程序

热门文章

  1. 交通运输部办公厅关于印发推进智慧交通发展行动计划(2017-2020年)的通知
  2. 浅析 SQL Server 的 CROSS APPLY 和 OUTER APPLY 查询 - 第一部分
  3. 简洁明了的ReentrantReadWriteLock总结
  4. android自定义三级下拉,Android自定义下拉框的简单实现
  5. 作品交流:图书配套资源下载方法
  6. js怎么进行数字相加
  7. 2018年教育技术十大趋势
  8. 把一个矩形变成圆角矩形
  9. java嵌套_Java嵌套类
  10. Windows7密码破解