论文解读:Detach and Adapt: Learning Cross-Domain Disentangled Deep Representation
论文题目:Detach and Adapt: Learning Cross-Domain Disentangled Deep Representation(CVPR2018 spotlight)
论文思路:主要提出跨域表征分离网络CDRD(Cross-Domain Representation Disentangler (CDRD))以及将CDRD和条件图像翻译相结合的拓展网络ECDRD(Extend),然后利用提出的网络解决无监督的分类领域自适应问题,以及条件图像翻译;
网络结构:
优化过程:
注意:该算法的源数据的标注是属性标注,如人脸中的表情标注(戴眼镜等),同时学习出的z是源域和目标域的公共特征空间,z是符合N(0,I)分布;其中ECDRD的结构和DISE的论文结构很像,输入源域和目标域数据,得到z,然后和属性结合自重建和交叉重建,区别是z可以是随机抽样得到,属性是标签,而且有额外的辅助分类器分类属性(借鉴ACGAN和infoGAN);
注意:本论文中属性是标签标注的,z是需要学到的公共特征空间,并且符合N(0,I)分布,在ECDRD中在源域和目标域得到的z需要和N(0,I)分布求KL散度,作为z的loss,同时借鉴论文ICML2016的Autoencoding beyond pixels using a learned similarity metric.衡量自重建的相似性,这也是一种perceptual loss;
可借鉴的地方:
1、本文的KL散度衡量公共特征空间z和N(0,I)分布,类似于DIRT中KL散度衡量随机抽样的属性分布N(0.1)和源域和目标域分离的属性之间的差异;只不过一个是属性空间,一个是特征空间’;2、可以借鉴自重建的感知损失的度量;
实验结果:
数据:
迁移效果:
其中论文只说了在手写字符的图像是16*16的灰度图resize成28*28的灰度图,其他的两个实验没说尺寸的问题,因此本文的条件图像翻译ECDRD在大尺寸的图像翻译上的效果有待考证;
最后做了一个超参数的实验:
lambda是图表中loss中判别器loss的加权值,ECDRD中:可见当网络中有多个loss时,不同loss之间的权重对结果的影响也很大;论文中取lambda=1;
论文解读:Detach and Adapt: Learning Cross-Domain Disentangled Deep Representation相关推荐
- 【论文解读】Cross-domain Correspondence Learning for Exemplar-based Image Translation
论文题目:Cross-domain Correspondence Learning for Exemplar-based Image Translation 论文主页:https://panzhang ...
- 论文解读《Evaluating the visualization of what a Deep Neural Network has learned》–阅读笔记
本文属于原创,转载请注明出处 *本论文解读的初衷: 1.由于某些原因,最近有关注到神经网络可解释性与可视化方向的发展. 2.本人习惯阅读优秀的博文后直接点赞收藏,而这篇却没有搜到相关解读,不知道是不是 ...
- 三维目标检测---BtcDet论文解读 Behind the Curtain: Learning Occluded Shapes for 3D Object Detection
个人博客 代码链接 paper链接 提出的问题 作者首先指出LiDAR帧其实不是严格意义上的3D结构,而是一个2.5D的结构.因为LiDAR通常只能获得目标靠近传感器那部分的结构特征,远离传感器部分的 ...
- CVPR2020最全整理:分方向论文下载,Github源码、论文解读等[计算机视觉][目标检测]
CVPR2020在2月24日公布了所有接受论文ID,相关报道:1470篇!CVPR2020结果出炉,你中了吗?(附部分论文链接/开源代码/解读).自论文ID公布以来,许多开发者都分享了自己的优秀工作. ...
- 细粒度分类:DBTNet(Deep Bilinear Transform)(一)论文解读
文章目录 前言 一.参考论文 二.论文解读 摘要 1.简介 2.相关工作 3.Deep Bilinear Transform 3.1 Semantic Grouping Layer 语义分组层 3.2 ...
- 论文解读:《开发和验证深度学习系统对黄斑裂孔的病因进行分类并预测解剖结果》
论文解读:<Development and validation of a deep learning system to classify aetiology and predict anat ...
- 自监督学习(Self-Supervised Learning)多篇论文解读(上)
自监督学习(Self-Supervised Learning)多篇论文解读(上) 前言 Supervised deep learning由于需要大量标注信息,同时之前大量的研究已经解决了许多问题.所以 ...
- 论文解读《Semi-Supervised Semantic Segmentation with Cross Pseudo Supervision》
论文解读<带有交叉伪监督的半监督式语义分割法> 论文出处:CVPR2021 论文地址:论文地址 代码地址:代码地址 一 摘要: (1) 本文通过研究有标签数据和无标签数据,研究了半监督语义 ...
- 论文解读:Taking A Closer Look at Domain Shift: Category-level Adversaries for Semantics Consistent
论文题目:Taking A Closer Look at Domain Shift Category-level Adversaries for Semantics Consistent Domain ...
- 自监督学习(Self-Supervised Learning)多篇论文解读(下)
自监督学习(Self-Supervised Learning)多篇论文解读(下) 之前的研究思路主要是设计各种各样的pretext任务,比如patch相对位置预测.旋转预测.灰度图片上色.视频帧排序等 ...
最新文章
- ADO.NET与ORM的比较(5):MyBatis实现CRUD
- STL源代码分析(ch 1)组态1
- 【技术】交换机上如何对流量拦截
- UOJ - #117. 欧拉回路(模板)
- 学习方法之02掌握记忆方法,在学习上就赢了一半
- 吴恩达作业7:梯度下降优化算法
- 学习linux装,一个初学者的Linux学习之旅之Linux安装篇
- VSFTPD 安装与配置
- 简简单单认识call,apply,bind方法
- 学习WPF/Silverligter网站及资源
- 学生签到系统java_基于jsp的学生签到-JavaEE实现学生签到 - java项目源码
- KP26--输入成本中心的标准作业量(活动类型价格)
- 【UVa11584】划分成回文串
- 自动化测试 selenium 模块 webdriver使用
- Non-Interactive Guessing Number
- 解决电脑CPU占用率高问题
- MySQL连接查询——外连接
- ARM汇编指令(B/BL/BX)
- CAN-BUS协议粗浅学习
- m.soudashi.cn 地图_搜索引擎网站推广优化有什么技巧?
热门文章
- 黑马程序员14套经典IT教程+面试宝典
- 警告: PREMNMX is an obsolete function.解决办法
- 软件测试工程师面试题之操作系统
- 没用东西全部清掉_如何把电脑上无用的东西清理掉,在哪下载
- python实现程序自动运行的库_python tkiner实现自动打包程序
- 牛客刷题——part2
- 使用html2canvas实现超出浏览器部分截图
- python日历图_Python干货宝典!玩转内置模块:日历模块
- AndroidStudio之Git提交代码出现author ‘xxx‘ is not ‘Name ‘ and matches no existing author 的解决方法
- js-鼠标事件-拖放图片(对鼠标事件进一步加深印象)