论文地址:https://openaccess.thecvf.com/content/WACV2022/papers/Fele_C-VTON_Context-Driven_Image-Based_Virtual_Try-On_Network_WACV_2022_paper.pdf
项目地址:https://github.com/benquick123/C-VTON


作者提出了一个上下文驱动的虚拟试穿网络 (C-VTON),即使在具有挑战性的姿势配置和存在自我遮挡的情况下,也能令人信服地将选定的服装区域转移到目标对象。
C-VTON 的核心步骤有两个:

  1. 几何匹配部分,利用提出的身体部位几何匹配器(BPGM)可以有效地将目标服装与输入图像中的人的姿势对齐;
  2. 虚拟试衣合成部分,上下文感知生成器(CAG)在合成最终结果时利用各种类型的上下文信息试穿结果。

C-VTON 在 VITON 和 MPV 数据集的严格实验中进行评估,并与文献中的最先进技术进行比较。实验结果表明,所提出的方法能够产生照片般逼真和视觉上令人信服的结果,并且显着改进了现有的最新技术。

The Body-Part Geometric Matcher (BPGM)

与其他利用与clothing-agnostic 复杂人物表示方法不同,BPGM 仅依赖于**身体部位分割(DensePose)**来预测TPS参数,DensePose是一种包含25个通道(分别代表不同身体部位)的人体语义分割模型。
BPGM的架构采用了CP-VTON中GMM的结构,包含两个编码器分别用来编码DensePose和in-shop服装C,之后对编码的特征进行L2正则化后进行Correlation经过回归层的到预测的TPS参数θ。

BPGM使用了3种损失函数来进行模型训练:

  1. 目标形状损失(Lshp):鼓励变形过程将目标服装呈现为与主体 I 的姿势相匹配的形状

  1. 外观损失(Lapp):迫使身体区域内扭曲的衣服 Cw 的视觉外观尽可能与输入图像 I 相似

  1. 感知损失(Lvgg):确保目标服装及其变形版本在身体区域内包含相同的语义内容

其中Lshp计算扭曲后的Mask和reference的目标部分的Mask之间的L1 Loss,而Lapp和Lvgg计算DensePose躯干部分的扭曲后服装和原始图像之间的L1 Loss及VGG Loss。

The Context-Aware Generator (CAG)

CAG由一系列 ResNet 块和 (2×) 上采样层组成,并增加了本文所提出的上下文感知标准化 (CAN) 操作。 CAN 层旨在有效地利用来自图像上下文的信息。如图 4(a) 所示,这是在不同的分辨率下完成的,以确保生成器的激活在不同的粒度级别上进行空间归一化,以及关于目标语义布局和合成输出所需外观的信息是在整个生成器中有效传播。
每个 ResNet 块都有两个输入:图像上下文和来自前一个模型层的激活图。而生成器的第一个 ResNet 块对两个输入都使用最小分辨率(8×6 像素)的图像上下文。
如图4(b)所示,ResNet 块由一系列批量归一化和卷积层组成,并且重复两次,CAN 操作在卷积层之前可以表示为:

CAG的训练用到了4个损失,其中有感知损失 (Lper) 鼓励生成器在语义方面产生尽可能接近参考输入图像的虚拟试穿结果,其他3个损失分别由三个辨别器定义,Dseg用于保证其通过预测分割图分布来生成逼真的身体部位,Dmatch旨在鼓励生成器通过预测目标服装 C 是否对应于 I 或 Ic 中所穿的服装来将输出图像与所需的目标服装合成,Dptc通过关注基于分割图从固定位置采样的局部补丁的外观来产生损失。

【虚拟试衣论文笔记】C-VTON: Context-Driven Image-Based Virtual Try-On Network相关推荐

  1. 【虚拟试衣论文笔记】CP-VTON+: Clothing Shape and Texture Preserving Image-Based Virtual Try-On

    论文地址:http://users.cs.cf.ac.uk/Paul.Rosin/resources/papers/CP-VTON+.pdf 项目地址:https://github.com/minar ...

  2. 【虚拟试衣论文笔记】M3D-VTON: A Monocular-to-3D Virtual Try-On Network

    论文地址: 项目地址:https://github.com/fyviezhao/M3D-VTON 本文提出了一种 Monocular-to-3D Virtual Try-On Network (M3D ...

  3. 【虚拟试衣论文笔记】Towards Scalable Unpaired Virtual Try-On via Patch-Routed Spatially-Adaptive GAN

    论文地址:https://proceedings.neurips.cc/paper/2021/file/151de84cca69258b17375e2f44239191-Paper.pdf 项目地址: ...

  4. 论文笔记—A Review of Visual-LiDAR Fusion based Simultaneous Localization and Mapping

    论文笔记-A Review of Visual-LiDAR Fusion based Simultaneous Localization and Mapping 论文链接 文章摘要 ~~~~    ~ ...

  5. 论文阅读06——《CaEGCN: Cross-Attention Fusion based Enhanced Graph Convolutional Network for Clustering》

    欢迎到我的个人博客看原文 论文阅读06--<CaEGCN: Cross-Attention Fusion based Enhanced Graph Convolutional Network f ...

  6. wFlow(CVPR2022)-虚拟试衣论文解读

    文章目录 解决问题 算法 stage1: 有条件人体分割 stage2: pixel flow估计 stage3: 使用wFlow进行衣服迁移 wFlow GTN 损失函数 在线循环优化 实验 数据集 ...

  7. 【论文笔记】DUDA‑Net: a double U‑shaped dilated attention network for automatic infection area segmentati

    声明 不定期更新自己精读的论文,通俗易懂,初级小白也可以理解 涉及范围:深度学习方向,包括 CV.NLP.Data fusion.Digital Twin 论文题目: DUDA‑Net: a doub ...

  8. 【虚拟试衣论文】Generating High-Resolution Fashion Model Images Wearing Custom Outfits

    论文地址:http://openaccess.thecvf.com/content_ICCVW_2019/papers/CVFAD/Yildirim_Generating_High-Resolutio ...

  9. AI 虚拟试衣 论文汇总

    猜您喜欢: 深入浅出stable diffusion:AI作画技术背后的潜在扩散模型论文解读  戳我,查看GAN的系列专辑~! 一顿午饭外卖,成为CV视觉的前沿弄潮儿! 最新最全100篇汇总!生成扩散 ...

最新文章

  1. Nginx 从安装到高可用
  2. 简单总结一下.net获得虚拟目录几个基本操作
  3. OpenCV 相机校正
  4. app engine_Google App Engine:在您自己的域中托管应用程序
  5. opengl 教程(18) 漫反射光
  6. java 读取 jar properties_java:如何读取properties文件内容
  7. 单片机重要组成部分还有什么,引脚封装分布知识讲解(二)
  8. 反射(一)动态加载类
  9. 算法:判断二叉树是否包含链表Linked List in Binary Tree
  10. 一峰说:SpringCloud的基础了解和使用
  11. 谨慎redis的timeout参数
  12. 穷养儿富养女 很多人都不知道这句话的真正含义
  13. java中flush函数作用_Java语言中flush()函数作用及使用方法详解
  14. keil_5.26 MDK版,汉化
  15. [转载]屏蔽双显卡笔记本的独显
  16. js之for in循环遍历对象(包括输出value值为什么是obj[k]而不是obj.k)
  17. 页面截图导出为PDF,以及PDF强行截断分页问题的处理
  18. KingbaseES V8R6运维案例之---wal日志解析DDL操作
  19. PS插件:Photoshop遥感影像处理插件
  20. 分享一款微信多开小工具:微信多开助手PC版

热门文章

  1. maya 白天室内灯光_求解maya室内灯光怎么打
  2. 关于使用计算机调查报告的目的,关于大学生电脑使用情况调查的实践报告(终.doc...
  3. 预解释是一种毫无节操的机制
  4. SUSE史上首位女性CEO Melissa Di Donato,不止有“三把火”
  5. JAVA开源仿知乎问答源码
  6. 【保研】-- 保研夏令营中英语口语技巧问题
  7. 使用python matplotlib实现动图绘制
  8. 无法卸载程序怎么办?
  9. 如何分析一个网站的SEO情况
  10. JDBC连接Sql_Server_2005