自动图像标注总述:

是图像语义理解的热点,是 无标注图像内容的语义关键词
属于图像检索领域,是图像 语义检索(相当成熟 )关键
涉及计算机视觉,机器学习,信息检索
总实现思路:用(已标注图像集)或 关联,映射关系(可获信息 自动学习语义空间 与 视觉特征空间)。预测未知图像标注。

现实现方法:

基于分类的标注,概率关联标注,图学习的标注

相关的领域:

基于内容的 图像检索,瓶颈,巨大挑战(语义鸿沟:低层视觉特征,颜色 纹理形状 ,不能完全匹配 用户查询信息)
基于语义的 图像检索,仍旧是 难题

应用:

网络搜索引擎:用户喜好关键词查询,互联网搜索引擎基于 文本的图像检索,人工标注费时费力
个人桌面照片管理,互联网广告自动投放


题目:自动图像标注技术 研究进展

搜索源:知网
关键词:自动图像标注; 多示例学习; 多标记学习; 图学习; 概率建模;

摘要

自动图像标注(AIA):是图像语义理解的热点,是无标注图像内容的语义关键词
思想:用(已标注图像集)或 关联,映射关系(可获信息 自动学习语义空间 与 视觉特征空间)。预测未知图像标注。
现实现的方法:基于分类的标注,概率关联标注,图学习的标注
基于全局特征,基于区域划分

0     引言

基于内容的 图像检索,瓶颈,巨大挑战(语义鸿沟:低层视觉特征,颜色 纹理形状 ,不能完全匹配 用户查询信息)
基于语义的 图像检索,仍旧是 难题
为什么 出现了 AIA:用户喜好关键词查询,互联网搜索引擎基于 文本的图像检索,人工标注费时费力
AIA:解决 语义鸿沟(高层语义,底层特征 间 联系)
现有算法:在图像级别实现关键词标注, 未建立一一对应关系(图像和关键词 之间),
标准方法:标注,区域命名
不同角度分析标注:
图像特征表示机制:图像全局视觉信息 ,基于区域划分

  1. 图像全局视觉信息:面向图像场景 语义,图像特征,文本标注词完全分离,纯视觉比较图像相似性,有监督
    已经标注 图像(图像特征,标注词间关系),标注(比较视觉特征,传播标注词)
  2. 图像划分若干同 质区域,图像子块。基于区域划分(主流),图像语义标注。图像分割算法,有效划分语义对象单元。

本文 :

基于全局特征,基于区域划分(根据特征提取,表示机制 的不同)
其中,基于区域划分:分类的标注算法 ,概率关联模型的标注方法,基于图学习的标注方法(学习算法 不同 )

1     基于全局特征的自动图像标注方法

早期:相当于图像场景的自动分类

ova:面向 图像 场景语义(图像空间属性,产生现实场景有意义描述,验证 全局统计特征, 分析场景的对象存在与否),免去(图像分割)
面向显著兴趣点:显著区域的 局部描述 子向量空间,通过相似图像传播语义实现自动标注
Yav sk:单纯用(图像全局特征)语义标注,建模框架(鲁棒的非参数密度估计法),核平滑技术–>用全局的 颜色信息可以标注性能。分割方法硬划分

优点:

免除过程(图像区域分割,区域聚类,三维注释,面向对象分析)
适用:简单图形,背景单一(纹理图形,自然场景,建筑物图像)
特点:只提供粗粒度语义描述,无前景物体和背景差异(人注重有语义信息的特定目标,非背景)

缺点:

因为粗粒度,不能反映丰富的细节语义内容,标注性能不理想

希望改进:

将图像前景目标区域,从背景中分割,想要对象级语义描述,减少背景变化的影响,更接近语义检索目标
提取区域级的低层视觉特征,比全局特征更贴近实际理解,出现了基于区域划分的图像标准

2     基于区域划分的自动图像标注方法

基于区域划分:分割图像成若干区域(图像分割算法) --> 提取每个区域的低层视觉特征 --> 建立关联(图像区域和 标注词间,区域分块的标注算法不同:基于分类图像标注,概率关联模型的图像标注,基于图学习 )

2.1   基于分类的自动图像标注算法

标注问题看成图像语义分类问题(每个语义关键词–看成–类别标记,图像标注问题 --转化–图像分类问题 ):从图像分类角度解决标注问题。
传统图像分类:每幅图像 只属于某个语义类别
自动图像标注:

关键词角度 :每幅图像可同时属于多个语义类别(标注有多个关键词),标注问题是多标记学习问题
图像角度:整幅图看成多个 示例(区域)组成 的包,示例(没有概念标记),包(有概念标记),正包(包中正例>=1),反包(包中正例=0),给定的训练集上关键词只标注在整幅图像,未知对应关系(关键词和图像区域之间)

目前:分类标注(从示例学习的角度,或多标记学习 角度)标注 问题
相同点:利用(已知的标注数据)建立模型,描绘 关联或映射 关系(文本词汇 图像特征间)

2.2   基于概率关联模型的自动图像标注算法
2.3   基于图学习的自动图像标注算法
3     总结

论文梳理(图像标注)相关推荐

  1. 论文笔记--基于 FCM 聚类的跨模态人物图像标注方法-2015

    期刊论文-基于 FCM 聚类的跨模态人物图像标注方法-2015-微型电脑应用-赵昀,张翌翀 文末附人脸标注相关论文下载地址 文章目录 摘要 技术 人脸检测与特征表示(与2012年吴伟硕士论文<跨 ...

  2. 华人一作统一「视觉-语言」理解与生成:一键生成图像标注,完成视觉问答,Demo可玩...

    来源:机器学习研究组订阅 这个 BLIP 模型可以「看图说话」,提取图像的主要内容,不仅如此,它还能回答你提出的关于图像的问题. 视觉 - 语言预训练 (Vision-Language Pre-tra ...

  3. 横向比较图像标注中的两种基于近邻思想的方法 TagProp和SGSSL

    利用近邻传递标签的思想进行图像标注在近几年的图像标注工作中取得了很好的效果,甚至有点难以超越的感觉了.其中最具有代表性的是09年ICCV上的 <TagProp:Discriminative Me ...

  4. ACL/NAACL‘22 推荐系统论文梳理

    2022推荐系统论文梳理系列 推荐系统相关顶会整理 IJCAI'22 推荐系统论文梳理 ICML/ICLR'22 推荐系统论文梳理 WWW'22 推荐系统论文之序列推荐篇 WWW'22 推荐系统论文之 ...

  5. 【图像标注】NLP+VS︱深度学习数据集标注工具、图像语料数据库、实验室搜索ing

    因为不太会使用opencv.matlab工具,所以在找一些比较简单的工具.  .  . 一.NLP标注工具BRAT BRAT是一个基于web的文本标注工具,主要用于对文本的结构化标注,用BRAT生成的 ...

  6. 计算机视觉中的图像标注工具总结

    本文来自公众号CV技术指南资源分享系列 创建高质量的数据集是任何机器学习项目的关键部分.在实践中,这通常比实际训练和超参数优化花费的时间更长.因此,选择合适的标注工具至关重要.在这里,我们总结了一些用 ...

  7. 资源 | 深度学习图像标注工具汇总

    作者 | chaibubble 来源 | CSDN 网站 对于监督学习算法而言,数据决定了任务的上限,而算法只是在不断逼近这个上限.世界上最遥远的距离就是我们用同一个模型,但是却有不同的任务.但是数据 ...

  8. Curve-GCN图像标注

    Curve-GCN是一种高效交互式图像标注方法,其性能优于Polygon-RNN++.在自动模式下运行时间为29.3ms,在交互模式下运行时间为2.6ms,比Polygon-RNN ++分别快10倍和 ...

  9. 图像分割 | FCN数据集制作的全流程(图像标注)

    图像分割 | FCN数据集制作的全流程(图像标注) 一 全卷积神经网络 文章所有代码已上传至github,觉得好用就给个star吧,谢谢 https://github.com/315386775/FC ...

最新文章

  1. GNU make manual 翻译(八十八)
  2. iOS开发中标签控制器的使用——UITabBarController
  3. GRE OVER IPSEC
  4. 这 5 个能挣钱的 SpringBoot 项目,真TMD香!
  5. RT-Thread uart串口设备驱动代码结构剖析
  6. 一张图告诉你E-R图怎么画
  7. Nat Biotechnol | 大神李恒团队开发不依赖于亲本的单倍型基因组组装工具hifiasm
  8. 微信小程序种利用轮播图实现tab栏切换
  9. 同程Z世代红色旅游报告:《觉醒年代》带火上海
  10. 计算机网络专业的论文题目,计算机网络技术专业毕业论文题目(3)
  11. FPGA图像处理 —— fpga实现cameralink接口图像传输
  12. 直播内容抢先看|基于 AUTOSAR 技术的 SOA 软件平台实践
  13. 解决nginx 503 Service Temporarily Unavailable 方法
  14. Cocoa设计模式(iOS常用设计模式) Cocoa Design Patterns
  15. 快速找出bug的几点建议
  16. 怎样将系统防御升到服务器级别,H3C IPS入侵防御系统 Web配置手册-5PW104
  17. [学习笔记]多项式与有标号简单图计数
  18. 02 FinalReference.referent的回收时机
  19. 20140627-STM8L101F3P6关于微秒级延时函数不同写法的波形
  20. natapp九折邀请码

热门文章

  1. HTML学习笔记二--表单及表格的结合使用个人简历制作
  2. 60秒验证码JQ60秒验证码
  3. 《即刻电音》:大张伟遭遇“团灭”危机情绪失控
  4. 拜登签署数字资产行政令,将研发美国 CBDC 选项置于最紧迫位置
  5. 一言不合就越狱!盘古团队越狱 iOS 10
  6. 【论文笔记】Enhanced Decentralized Autonomous Aerial Swarm with Group Planning
  7. 华为 vlan 端口隔离
  8. 基于微信买菜小程序系统设计与实现 开题报告
  9. 苏州新导智慧养老解决方案解决养老一切问题,智能化智慧养老方案
  10. 蚂蚁CMS分类信息系统-蚂蚁CMS分类信息系统搭建配置教程