RES 新的数据集 Advancing Referring Expression Segmentation Beyond Single Image 论文笔记
RES 新的数据集 Advancing Referring Expression Segmentation Beyond Single Image 论文笔记
- 一、Abstract
- 二、引言
- 三、相关工作
- 3.1 Referring Expression Segmentation (RES)
- 3.2 CoSalient Object Detection (CoSOD)
- 四、提出的方法
- 4.1 概述
- 文本 & 图像编码器
- TQM & Heatmap Hierarchizer
- Mask 预测器
- 4.2 Triphasic Query Module (TQM)
- 4.3 Heatmap Hierarchizer
- 4.4 训练目标
- 负样本训练
- 三重阈值损失
- 镜像训练策略
- 目标函数
- 五、提出的数据集
- 5.1 数据集亮点
- 5.2 构建步骤
- 5.3 数据统计
- 六、实验
- 6.1 数据和指标
- 6.2 实施细节
- 6.3 与 SOTA 方法的比较
- 在 GRES 设置上的结果
- 在 RES 设置上的结果
- 在 Co-SOD 设置上的结果
- 6.4 消融实验
- Triphasic Query Module (TQM)
- Heatmap Hierarchizer (HMapHier)
- Mirror Training (MirrorT)
- Triplet Margin Loss (TriLoss)
- 七、结论
写在前面
最近一直在看 Arxiv,好像已经没有多少关于实例分割框架了。目前以跨模态,多模态的 Zero-shot 居多,这也是个发展趋势,大家都在整大模型了。这次的论文笔记是挑选一篇这两天放出来的 Arxiv 文章,关于参考表达式分割。
- 论文地址:Advancing Referring Expression Segmentation Beyond Single Image
- 代码地址:https://github.com/yixuan730/group-res,暂未放出完整版
- 预计投稿于某个顶会
- PS:2023 年每周一篇博文,主页更多干货,欢迎关注吖,4千粉丝期待有你的参与呦
RES 新的数据集 Advancing Referring Expression Segmentation Beyond Single Image 论文笔记相关推荐
- Semi-Supervised Semantic Segmentation with Cross-Consistency Training论文笔记
文章标题:Semi-Supervised Semantic Segmentation with Cross-Consistency Training 文章地址:https://arxiv.org/ab ...
- 论文:Discriminative Triad Matching and Reconstruction for Weakly Referring Expression Grounding
作者 Abstract In this paper, we are tackling the weakly-supervised referring expression grounding task ...
- VLN阅读报告4:REVERIE: Remote Embodied Visual Referring Expression in Real Indoor Environments(CVPR2020)
REVERIE任务更加具体地给出了更具有挑战性的任务:根据指令在没见过的环境中识别对象. REVERIE: Remote Embodied Visual Referring Expression in ...
- PolyFormer: Referring Image Segmentation as Sequential Polygon Generation 论文阅读笔记
PolyFormer: Referring Image Segmentation as Sequential Polygon Generation 论文阅读笔记 一.Abstract 二.引言 三.相 ...
- 解决参考图像分割中的随机性问题:MMNet: Multi-Mask Network for Referring Image Segmentation 论文阅读笔记
解决参考图像分割中的随机性问题:MMNet: Multi-Mask Network for Referring Image Segmentation 论文阅读笔记 一.Abstract 二.引言 三. ...
- ECCV 2020《Linguistic Structure Guided Context Modeling for Referring Image Segmentation》论文笔记
目录 简介 动机 贡献 方法 实验 简介 本文出自北航刘偲老师colab,使用语言结构引导上下文建模,用于Referring Image Segmentation. 下载链接 动机 解决Referri ...
- 论文:Language-Aware Fine-Grained Object Representation for Referring Expression Comprehension
作者 Abstract Referring expression comprehension expects to accurately locate an object described by a ...
- 微软发布代码智能新基准数据集CodeXGLUE,多角度衡量模型优劣
来源 | 微软研究院AI头条 编者按:代码智能(code intelligence)目的是让计算机具备理解和生成代码的能力,并利用编程语言知识和上下文进行推理,支持代码检索.补全.翻译.纠错.问答等场 ...
- 如何将一个逻辑库下所有数据集的名称汇总生成新的数据集BY:crackman
有些时候我们需要知道某个逻辑库下的所有数据集的名称,并把这些数据集名称汇总为一个新的数据集. 第一种方法:用proc contents过程 proc contentsdata=SASHELP._all ...
最新文章
- 跨平台C++开源码的两种经常使用编译方式
- 1.13 空字符串和null的区别
- ubuntu最基本的软件
- linux_redhat_线程后台运行方法
- client mac addr不能开机进不去系统_用asp.net core结合fastdfs打造分布式文件存储系统
- 如何取消重要地点加密_西门子S7-300/400PLC编程之软件加密
- DSP之时钟与定时器之三RTC
- 创新的垃圾处理模式——赛普利
- 28天肝完阿里面试通关宝典,含答案解析
- 超声波测距(含报警功能)
- 管理系统中计算机应用 tps,全国1月自学考试管理系统中计算机应用试题(5)
- python爬取qq音乐歌词风变编程_爬取QQ音乐歌词
- TOGAF认证考试总结
- 金融学python应该学哪些知识_哪些Python基础知识必学
- POI加密Excel文件导出
- 【MM小贴士】SAP创建成本中心采购订单带出默认会计科目和成本中心
- SVN各个状态:A C D M G U R I具体含义
- 2.5维电子地图关键技术研究与实现
- 路由巧设置 局域网轻松限制BT下载
- RGB颜色值与十六进制颜色码对照表
热门文章
- MyBatis:Invalid bound statement (not found)
- 崇州鸡冠山 地图 攻略 图片 GPS 经纬度 海拔 OZI
- RFC821 简单邮件传输协议(SMTP)
- 计算机神经影像学是干什么的,神经系统常用的影像学检查有哪些?
- Tensorflow TFRecord: Can't parse serialized example
- 详解代码覆盖率及各语言主流工具
- 夜莺(Flashcat)V6监控(四):categraf-mtail日志收集插件详解
- 【转】招行的密码有很多种(一直挺…
- html 自定义 radio 颜色
- 【数据分析基本流程】明确目标——数据处理——数据分析——数据展现——报告撰写
- Semi-Supervised Semantic Segmentation with Cross-Consistency Training论文笔记