:该文章发表于CVPR2020,文章主体框架建立在2019年“MS-TCN: Multi-Stage Temporal Convolutional Network for Action Segmentation”的基础上,欢迎查阅:MS-TCN介绍

论文原题:Action Segmentation with Joint Self-Supervised Temporal Domain Adaptation
原文地址:https://arxiv.org/abs/2003.02824

论文的目标为“行为分割”(Action Segmentation),由于文章的主体网络结构建立在MS-TCN的基础之上,这里我只对本文的Contribution进行介绍。

论文的Motivation是通过使用自监督学习(Self-supervised learning)来解决训练样本及测试样本之间可能存在的Domain variation问题(例如,不同的个体,在执行相同的action时可能有不同的习惯,若在训练集(source)及测试集(target)之间存在较大的差异,则会给模型精度带来很大的影响)。所谓自监督学习,就是通过使用无需标记的样本,建立某些辅助任务(auxiliary tasks),来学得更好的特征表示,从而为目标任务带来帮助,那么现在问题就是如何设计一个好的auxiliary task,来帮助我们解决Domain variation 问题。

机器学习领域一个专门解决此类问题的方向为领域自适应Domain Adaption, DA),属于迁移学习的一个分支。作者使用了对抗学习(adversarial learning)的方式(类似于GANs),试图通过无标记视频序列,学得Domain invariant feature,从而使得Domain variation问题得到解决。为此,作者设计了两个self-supervised auxiliary tasks, 分别用于逐帧(frame-wise)特征提取以及对时间序列片段的特征提取(sequence-wise),接下来分别对这两部分进行介绍。

1. Local SSTDA (Frame-wise)

上图的左侧部分为Local SSTDA,用于逐帧(frame-wise)特征提取的自监督学习,为了解决domain variation问题(也就是减缓source(训练数据)及target(测试数据)之间特征表示的差异性),如上文所述,这里使用类似于GANs中的对抗学习。设计一个判别器Discriminator GldG_{ld}Gld​,用于判断我们的输入数据是源自于source还是target(二分类问题),而我们的特征提取网络则希望学得domain-invariant的特征,从而欺骗判别器Discriminator。在两者的交替更新之下,最达到纳什均衡。

2. Global SSTDA

Global SSTDA与上文所述的Local SSTDA类似,区别在于其用于提取对连续时间序列片段进行特征提取(sequence-wise),作者首先分别原始的source及target中的的完整video截成一系列片段,对每个截出的片段,使用**DATP(Domain Attentive Temporal Pooling)**进行特征提取,获得每个clip的特征向量,随后将这些源自source及target的片段进行随机打乱(shuffle)及拼接,输入后续的Discriminator进行类别预测(from source or target)。该部分的损失函数类似于Local SSTDA。
总损失函数loss function如下所示

SSTDA的自监督学习部分总体框下如下图所示:

Action Segmentation with Joint Self-Supervised Temporal Domain Adaptation相关推荐

  1. Unsupervised Action Segmentation by Joint Representation Learning and Online Clustering_CVPR 2022理解速

    Unsupervised Action Segmentation by Joint Representation Learning and Online Clustering_CVPR 2022 链接 ...

  2. 【弱监督学习】Weakly Supervised Adversarial Domain Adaptation for Semantic Segmentation in Urban Scenes

    0. 前言 本文是2019年发表在IEEE Transactions On Image Processing期刊上的一篇关于弱监督的城市场景语义分割的文章,文章中采用两个域分类器进行对抗训练,从而提高 ...

  3. 【ECCV 2020】Joint Visual and Temporal Consistency for Unsupervised Domain Adaptive Person Re-ID

    JVTC 1 背景知识 1.1Person Re-Identification (ReID) 1.2 supervised person ReID Problem #2 Problem #3 1.3 ...

  4. Unsupervised domain adaptation for cross-modality liver segmentation via joint adversarial learning

    0.Motivation CT 数据较多 较可信 MRI 含有较多的信息 因此希望可以将学习到的知识从包含标记CT图像的源域转移到包含未标记Mr图像的目标域,希望实现无监督域自适应(这有什么因果关系吗 ...

  5. 语义分割-Unsupervised Domain Adaptation in Semantic Segmentation:a Review语义分割中的无监督领域自适应:综述

    Unsupervised Domain Adaptation in Semantic Segmentation:a Review语义分割中的无监督领域自适应:综述 0.摘要 1.介绍 1.1.语义分割 ...

  6. Unsupervised Domain Adaptation with Variational Approximation for Cardiac Segmentation

    Wu F, Zhuang X. Unsupervised domain adaptation with variational approximation for cardiac segmentati ...

  7. 论文笔记-Domain Adaptation for Semantic Segmentation with Maximum Squares Loss

    论文信息 论文标题:Domain Adaptation for Semantic Segmentation with Maximum Squares Loss 论文作者:Minghao Chen, H ...

  8. 迁移学习——Joint Geometrical and Statistical Alignment for Visual Domain Adaptation

    <Joint Geometrical and Statistical Alignment for Visual Domain Adaptation>学习 2017 CVPR 文章目录 摘要 ...

  9. Skeleton-Based Action Recognition with Spatial Reasoning and Temporal Stack Learning 论文赏析

    Skeleton-Based Action Recognition with Spatial Reasoning and Temporal Stack Learning 论文赏析 前言 Introdu ...

  10. [论文速览]:Multi-source Domain Adaptation for Semantic Segmentation

    Multi-source Domain Adaptation for Semantic Segmentation [NeurIPS 2019] [2020: MADAN: Multi-source A ...

最新文章

  1. 关于百度分享——bdCustomStyle一点bug
  2. 开放273项AI能力,创建34万模型,汇聚265万开发者,百度大脑的2020成果一览
  3. 解决Hibernate4执行update操作,不更新数据的问题
  4. OpenCV-Python实战(18)——深度学习简介与入门示例
  5. 获取js文件后的参数
  6. 小贝拉机器人是朋友_被Angelababy、周震南等摸头杀?机器人贝拉凭什么受宠
  7. ehcache缓存共享(rmi方法)
  8. 个人博客 修改markdown代码块背景颜色
  9. Select2.js学习总结
  10. 2020-12-11静态路由汇总实验
  11. 最美翻译官(适配器模式)
  12. PyCharm下载和安装
  13. 《人月神话》作者去世,我们都曾读过他的书
  14. 收单外包机构备案业务类型汇总分析
  15. 微型计算机硬盘接口有哪些,什么是硬盘(硬盘接口有哪些)
  16. 30岁女IT月薪3W的背后:从数据报表到数仓、中台,这工具帮了大忙
  17. item_get_app - 根据ID取商品详情原数据
  18. 在 Visual Studio Code 中添加自定义的代码片段
  19. Android怎么自定义充电铃声,安卓手机怎么自定义充电提示音_自定义安卓充电提示音教程_3DM手游...
  20. 脱机外挂的命令大揭秘

热门文章

  1. 电子计算机硬件是由哪五个部分构成,计算机硬件系统由哪五个基本部分组成?...
  2. Linux audit详解
  3. [SAP ABAP开发技术总结]搜索帮助Search Help (F4)
  4. 安全圈年终大趴,FIT 2019首日盛况全程回顾
  5. 《气候宣言》宣布100多家签约组织,承诺至2040年或更早实现净零碳排放
  6. ubuntu txt文件打开乱码怎么恢复正常
  7. html实现网页多人聊天,实现websocket多人聊天,很简单(示例代码)
  8. 【DDD落地实践系列】DDD领域驱动设计如何进行工程化落地
  9. 转载.NET技术-.NET各大网站-编程技术网址 - Road - 博客园
  10. leetcode237题解