一文了解图像标注类型
图像标注就是利用人工或者AI等技术对图像特征打上特定类型标签的一个过程,其发展大致经过以下三个过程:基于文本的人工图像标注,由观察员实现所见即所得;基于内容的自动图像标注,采用深度学习等方式提取图像底层特征;基于语义的图像标注,可以对图像的语义内容进行分类,使标注脱离颜色、纹理等底层特征,实现从语义等高层特征进行图像检索等功能
常见的图像标注类型主要包括:分类标注、点标注、线标注、边界框、像素标注等,下文就这5种图像标注类型进行介绍
01.分类(classification)
分类标注是最基本的一种标注手段,其表现形式一般就是一张图对应一个数字标签,比如 Dogs vs. Cats数据集,该数据集共可分为dog和cat两类,因此标签设计时可以用0代表dog,1代表cat
02.点标注(keypoints)
点标注通常用于对图像特征较细致的场景,如人体姿态估计,人脸特征识别等
Leeds Sports Pose数据集中每张图像标注有 14 个关节位置,可以用于对人体姿势进行检测\评估
Wider Facial Landmarks in-the-wild (WFLW) 数据集对人的眉毛、眼睛、鼻子、嘴唇等部位进行标注( landmark annotation),用来对人脸特征进行定位。一个有趣的应用就是可以给歪果仁强行带上口罩(Artificial Mask)
03.线标注(line)
线标注最常用的应用场景就是自动驾驶领域,用来识别车道及边界
Lane Marker数据集对车道轨迹进行了标注
04.边界框(bounding box)
边界框标注主要用于对象检测,用来识别某个特征在图像中的具体位置,细分一下又可以分为2D边界框(Box2D)和3D边界框(Box3D)
CALTECH-Airplane detection数据集含有800张飞机类jpg图片,同时含有相应图片中飞机的2D边界框坐标
Audi Autonomous Driving Dataset (A2D2)是一个具有2D语义分割,3D点云,3D边界框和车辆总线数据功能的数据集,下图是其中关于3D边界框的标注
05.像素标注(pixel level label)
像素标注又称区域标注,是一种将图像中像素进行归类的标注方式,主要有语义分割和实例分割两种
KolektorSDD数据集由包含缺陷的电子换向器的图像构成,其缺陷部分的标注如右下图所示,可以看出这里将缺陷部位的像素置为1(白色),其余部位重置为0(黑色),实现了图像的语义分割
类似的还有CityScapes数据集,其专注于对城市街道场景的语义理解,包含有对车辆和人员的实例细分
Reference
[1]陈金菊.图像语义标注研究综述[J].图书馆学研究,2017(18):2-7+20.
[2]https://hackernoon.com/illuminating-the-intriguing-computer-vision-uses-cases-of-image-annotation-w21m3zfg
一文了解图像标注类型相关推荐
- 景联文科技提供全方位图像标注服务
图像标注在计算机视觉中起着至关重要的作用.图像标注是一个将标签添加到图像上的过程.其目标范围既可以在整个图像上仅使用一个标签,也可以在某个图像中的各组像素中配上多个标签.这些标签是由人工智能工程师预先 ...
- 如何为计算机视觉任务选择正确的标注类型
https://www.toutiao.com/a6714050151935115779/ 机器学习中的注释(Annotation)是标记数据的过程,可以是文本,视频,图像或音频等形式.在计算机视觉任 ...
- 一文读懂车载监控系统中的数据标注类型丨曼孚科技
近年来,车载视频监控的市场需求呈飞速上涨之势. 随着人工智能技术不断融入社会,越来越多的行业进行了技术革新.车载监控作为监控视频行业的细分子行业,是视频监控在交通领域的重要应用. 5G.物联网.车联网 ...
- 从单一图像中提取文档图像:ICCV2019论文解读
从单一图像中提取文档图像:ICCV2019论文解读 DewarpNet: Single-Image Document Unwarping With Stacked 3D and 2D Regressi ...
- 细粒度 文档图像版面分析
基于实例分割网络的细粒度文档图像版面分析 英文引用:Zhao P, Wang W, Cai Z, et al. Accurate Fine-Grained Layout Analysis for th ...
- 【图像标注】NLP+VS︱深度学习数据集标注工具、图像语料数据库、实验室搜索ing
因为不太会使用opencv.matlab工具,所以在找一些比较简单的工具. . . 一.NLP标注工具BRAT BRAT是一个基于web的文本标注工具,主要用于对文本的结构化标注,用BRAT生成的 ...
- 大咖齐聚CCIG论坛——文档图像智能分析的产业前沿
目录 1 文档图像智能分析技术 2 大咖齐聚CCIG@2023 3 议题介绍 3.1 从模式识别到类脑研究 3.2 视觉-语言预训练模型演进及应用 3.3 篡改文本图像的生成和检测 3.4 智能文档处 ...
- 图像标注技巧_保护互联网上图像的一个简单技巧
图像标注技巧 补习 (TUTORIAL) Have you ever worried about sharing your images on the Internet? Anytime you up ...
- PubLayNet:36万文档图像版面分析数据集
向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程 公众号:datayx PubLayNet是文档图像版面分析的大型数据集,其布局用多边形边框分割标注.文档的来源是Pu ...
最新文章
- LabVIEW图像特征与机器视觉概念(理论篇—4)
- GPS NMEA-0183协议常用报文数据格式
- codeup 二叉树(dfs超时版)
- py爬取英文文档学习单词
- system文件_大文件拷贝,试试NIO的内存映射
- C#设计模式系列:享元模式(Flyweight)
- 推荐 7 个 Github 上近 200k Star 的计算机学习资源,练好前端内功的秘籍!
- boost::mutex相关的测试程序
- 2020 华工 数据结构-平时作业_【激光】从上海工博会看华工激光的差异化路线...
- jQuery实现等比例缩放大图片让大图片自适应页面布局
- leetcode1025. 除数博弈(dp/数学)
- 在vue中动态添加商品SKU
- [抽奖解决方案]单位年终搞一次新颖的、与时俱进的抽奖方式,可使大家对这个单位或团队文化的强力认同。
- 区块链软件公司:什么时候区块链技术?
- 软件jmeter压力测试实例,jmeter压力测试案例实战
- DRF实战1 - 环境搭建
- C语言中access的使用
- java list 时间排序吗_java collection.sort()根据时间排序list | 学步园
- docker仓库的搭建居然只要一分钟!
- 几种x-ray产生的原理