Action Segmentation with Joint Self-Supervised Temporal Domain Adaptation
注:该文章发表于CVPR2020,文章主体框架建立在2019年“MS-TCN: Multi-Stage Temporal Convolutional Network for Action Segmentation”的基础上,欢迎查阅:MS-TCN介绍
论文原题:Action Segmentation with Joint Self-Supervised Temporal Domain Adaptation
原文地址:https://arxiv.org/abs/2003.02824
论文的目标为“行为分割”(Action Segmentation),由于文章的主体网络结构建立在MS-TCN的基础之上,这里我只对本文的Contribution进行介绍。
论文的Motivation是通过使用自监督学习(Self-supervised learning)来解决训练样本及测试样本之间可能存在的Domain variation问题(例如,不同的个体,在执行相同的action时可能有不同的习惯,若在训练集(source)及测试集(target)之间存在较大的差异,则会给模型精度带来很大的影响)。所谓自监督学习,就是通过使用无需标记的样本,建立某些辅助任务(auxiliary tasks),来学得更好的特征表示,从而为目标任务带来帮助,那么现在问题就是如何设计一个好的auxiliary task,来帮助我们解决Domain variation 问题。
机器学习领域一个专门解决此类问题的方向为领域自适应(Domain Adaption, DA),属于迁移学习的一个分支。作者使用了对抗学习(adversarial learning)的方式(类似于GANs),试图通过无标记视频序列,学得Domain invariant feature,从而使得Domain variation问题得到解决。为此,作者设计了两个self-supervised auxiliary tasks, 分别用于逐帧(frame-wise)特征提取以及对时间序列片段的特征提取(sequence-wise),接下来分别对这两部分进行介绍。
1. Local SSTDA (Frame-wise)
上图的左侧部分为Local SSTDA,用于逐帧(frame-wise)特征提取的自监督学习,为了解决domain variation问题(也就是减缓source(训练数据)及target(测试数据)之间特征表示的差异性),如上文所述,这里使用类似于GANs中的对抗学习。设计一个判别器Discriminator GldG_{ld}Gld,用于判断我们的输入数据是源自于source还是target(二分类问题),而我们的特征提取网络则希望学得domain-invariant的特征,从而欺骗判别器Discriminator。在两者的交替更新之下,最达到纳什均衡。
2. Global SSTDA
Global SSTDA与上文所述的Local SSTDA类似,区别在于其用于提取对连续时间序列片段进行特征提取(sequence-wise),作者首先分别原始的source及target中的的完整video截成一系列片段,对每个截出的片段,使用**DATP(Domain Attentive Temporal Pooling)**进行特征提取,获得每个clip的特征向量,随后将这些源自source及target的片段进行随机打乱(shuffle)及拼接,输入后续的Discriminator进行类别预测(from source or target)。该部分的损失函数类似于Local SSTDA。
总损失函数loss function如下所示
SSTDA的自监督学习部分总体框下如下图所示:
Action Segmentation with Joint Self-Supervised Temporal Domain Adaptation相关推荐
- Unsupervised Action Segmentation by Joint Representation Learning and Online Clustering_CVPR 2022理解速
Unsupervised Action Segmentation by Joint Representation Learning and Online Clustering_CVPR 2022 链接 ...
- 【弱监督学习】Weakly Supervised Adversarial Domain Adaptation for Semantic Segmentation in Urban Scenes
0. 前言 本文是2019年发表在IEEE Transactions On Image Processing期刊上的一篇关于弱监督的城市场景语义分割的文章,文章中采用两个域分类器进行对抗训练,从而提高 ...
- 【ECCV 2020】Joint Visual and Temporal Consistency for Unsupervised Domain Adaptive Person Re-ID
JVTC 1 背景知识 1.1Person Re-Identification (ReID) 1.2 supervised person ReID Problem #2 Problem #3 1.3 ...
- Unsupervised domain adaptation for cross-modality liver segmentation via joint adversarial learning
0.Motivation CT 数据较多 较可信 MRI 含有较多的信息 因此希望可以将学习到的知识从包含标记CT图像的源域转移到包含未标记Mr图像的目标域,希望实现无监督域自适应(这有什么因果关系吗 ...
- 语义分割-Unsupervised Domain Adaptation in Semantic Segmentation:a Review语义分割中的无监督领域自适应:综述
Unsupervised Domain Adaptation in Semantic Segmentation:a Review语义分割中的无监督领域自适应:综述 0.摘要 1.介绍 1.1.语义分割 ...
- Unsupervised Domain Adaptation with Variational Approximation for Cardiac Segmentation
Wu F, Zhuang X. Unsupervised domain adaptation with variational approximation for cardiac segmentati ...
- 论文笔记-Domain Adaptation for Semantic Segmentation with Maximum Squares Loss
论文信息 论文标题:Domain Adaptation for Semantic Segmentation with Maximum Squares Loss 论文作者:Minghao Chen, H ...
- 迁移学习——Joint Geometrical and Statistical Alignment for Visual Domain Adaptation
<Joint Geometrical and Statistical Alignment for Visual Domain Adaptation>学习 2017 CVPR 文章目录 摘要 ...
- Skeleton-Based Action Recognition with Spatial Reasoning and Temporal Stack Learning 论文赏析
Skeleton-Based Action Recognition with Spatial Reasoning and Temporal Stack Learning 论文赏析 前言 Introdu ...
- [论文速览]:Multi-source Domain Adaptation for Semantic Segmentation
Multi-source Domain Adaptation for Semantic Segmentation [NeurIPS 2019] [2020: MADAN: Multi-source A ...
最新文章
- 关于百度分享——bdCustomStyle一点bug
- 开放273项AI能力,创建34万模型,汇聚265万开发者,百度大脑的2020成果一览
- 解决Hibernate4执行update操作,不更新数据的问题
- OpenCV-Python实战(18)——深度学习简介与入门示例
- 获取js文件后的参数
- 小贝拉机器人是朋友_被Angelababy、周震南等摸头杀?机器人贝拉凭什么受宠
- ehcache缓存共享(rmi方法)
- 个人博客 修改markdown代码块背景颜色
- Select2.js学习总结
- 2020-12-11静态路由汇总实验
- 最美翻译官(适配器模式)
- PyCharm下载和安装
- 《人月神话》作者去世,我们都曾读过他的书
- 收单外包机构备案业务类型汇总分析
- 微型计算机硬盘接口有哪些,什么是硬盘(硬盘接口有哪些)
- 30岁女IT月薪3W的背后:从数据报表到数仓、中台,这工具帮了大忙
- item_get_app - 根据ID取商品详情原数据
- 在 Visual Studio Code 中添加自定义的代码片段
- Android怎么自定义充电铃声,安卓手机怎么自定义充电提示音_自定义安卓充电提示音教程_3DM手游...
- 脱机外挂的命令大揭秘
热门文章
- 电子计算机硬件是由哪五个部分构成,计算机硬件系统由哪五个基本部分组成?...
- Linux audit详解
- [SAP ABAP开发技术总结]搜索帮助Search Help (F4)
- 安全圈年终大趴,FIT 2019首日盛况全程回顾
- 《气候宣言》宣布100多家签约组织,承诺至2040年或更早实现净零碳排放
- ubuntu txt文件打开乱码怎么恢复正常
- html实现网页多人聊天,实现websocket多人聊天,很简单(示例代码)
- 【DDD落地实践系列】DDD领域驱动设计如何进行工程化落地
- 转载.NET技术-.NET各大网站-编程技术网址 - Road - 博客园
- leetcode237题解