RES 新的数据集 Advancing Referring Expression Segmentation Beyond Single Image 论文笔记

一、Abstract
二、引言
三、相关工作
- 3.1 Referring Expression Segmentation (RES)
- 3.2 CoSalient Object Detection (CoSOD)
四、提出的方法
- 4.1 概述
- - 文本 & 图像编码器
  - TQM & Heatmap Hierarchizer
  - Mask 预测器
- 4.2 Triphasic Query Module (TQM)
- 4.3 Heatmap Hierarchizer
- 4.4 训练目标
- - 负样本训练
  - 三重阈值损失
  - 镜像训练策略
  - 目标函数
五、提出的数据集
- 5.1 数据集亮点
- 5.2 构建步骤
- 5.3 数据统计
六、实验
- 6.1 数据和指标
- 6.2 实施细节
- 6.3 与 SOTA 方法的比较
- - 在 GRES 设置上的结果
  - 在 RES 设置上的结果
  - 在 Co-SOD 设置上的结果
- 6.4 消融实验
- - Triphasic Query Module (TQM)
  - Heatmap Hierarchizer (HMapHier)
  - Mirror Training (MirrorT)
  - Triplet Margin Loss (TriLoss)
七、结论

写在前面

最近一直在看 Arxiv，好像已经没有多少关于实例分割框架了。目前以跨模态，多模态的 Zero-shot 居多，这也是个发展趋势，大家都在整大模型了。这次的论文笔记是挑选一篇这两天放出来的 Arxiv 文章，关于参考表达式分割。

论文地址：Advancing Referring Expression Segmentation Beyond Single Image
代码地址：https://github.com/yixuan730/group-res，暂未放出完整版
预计投稿于某个顶会
PS：2023 年每周一篇博文，主页更多干货，欢迎关注吖，4千粉丝期待有你的参与呦

RES 新的数据集 Advancing Referring Expression Segmentation Beyond Single Image 论文笔记相关推荐
1. Semi-Supervised Semantic Segmentation with Cross-Consistency Training论文笔记
  文章标题:Semi-Supervised Semantic Segmentation with Cross-Consistency Training 文章地址:https://arxiv.org/ab ...
2. 论文：Discriminative Triad Matching and Reconstruction for Weakly Referring Expression Grounding
  作者 Abstract In this paper, we are tackling the weakly-supervised referring expression grounding task ...
3. VLN阅读报告4：REVERIE: Remote Embodied Visual Referring Expression in Real Indoor Environments(CVPR2020)
  REVERIE任务更加具体地给出了更具有挑战性的任务:根据指令在没见过的环境中识别对象. REVERIE: Remote Embodied Visual Referring Expression in ...
4. PolyFormer: Referring Image Segmentation as Sequential Polygon Generation 论文阅读笔记
  PolyFormer: Referring Image Segmentation as Sequential Polygon Generation 论文阅读笔记一.Abstract 二.引言三.相 ...
5. 解决参考图像分割中的随机性问题：MMNet: Multi-Mask Network for Referring Image Segmentation 论文阅读笔记
  解决参考图像分割中的随机性问题:MMNet: Multi-Mask Network for Referring Image Segmentation 论文阅读笔记一.Abstract 二.引言三. ...
6. ECCV 2020《Linguistic Structure Guided Context Modeling for Referring Image Segmentation》论文笔记
  目录简介动机贡献方法实验简介本文出自北航刘偲老师colab,使用语言结构引导上下文建模,用于Referring Image Segmentation. 下载链接动机解决Referri ...
7. 论文：Language-Aware Fine-Grained Object Representation for Referring Expression Comprehension
  作者 Abstract Referring expression comprehension expects to accurately locate an object described by a ...
8. 微软发布代码智能新基准数据集CodeXGLUE，多角度衡量模型优劣
  来源 | 微软研究院AI头条编者按:代码智能(code intelligence)目的是让计算机具备理解和生成代码的能力,并利用编程语言知识和上下文进行推理,支持代码检索.补全.翻译.纠错.问答等场 ...
9. 如何将一个逻辑库下所有数据集的名称汇总生成新的数据集BY:crackman
  有些时候我们需要知道某个逻辑库下的所有数据集的名称,并把这些数据集名称汇总为一个新的数据集. 第一种方法:用proc contents过程 proc contentsdata=SASHELP._all ...
最新文章
热门文章

RES 新的数据集 Advancing Referring Expression Segmentation Beyond Single Image 论文笔记

RES 新的数据集 Advancing Referring Expression Segmentation Beyond Single Image 论文笔记

RES 新的数据集 Advancing Referring Expression Segmentation Beyond Single Image 论文笔记相关推荐

最新文章

热门文章