pix2pixhd_基于pix2pixHD的行人图像生成
基于
pix2pixHD
的行人图像生成
程
平
【摘
要】
摘要:本文提出了一个基于行人姿态
mask
利用条件生成对抗网络来
生成逼真的行人图像的方法,使用了一种最新的
adversarial
loss
和最新的多
尺度生成器
-
判别器结构来增加提高行人图像细节。实验表明,通过使用成对的
行人姿态
mask
和行人图像训练后的
pix2pixHD
网络可以生成了一幅视觉吸引
人的具有目标姿态不同属性性质的行人图像。
【期刊名称】
《数字通信世界》
【年
(
卷
),
期】
2019(000)009
【总页数】
2
【关键词】
姿态
mask
;
pix2pixHD
网络;行人图像生成
文献标示码:
A
文章编码:
1672-7274
(
2019
)
09-0004-02
1 pix2pixHD
图像处理的很多问题都是将一张输入的图片转变为一张对应的输出图片,比如
灰度图、梯度图、彩色图之间的转换等。通常每一种问题都使用特定的算法如:
使用
CNN
来解决图像转换问题时,要根据每个问题设定一个特定的损失函数
来让
CNN
优化。这些方法的本质其实都是从像素到像素的映射。“翻译”常
用于语言之间的翻译,就比如中文和英文的之间的翻译。但是图像翻译的意思
是以不同形式在图与图之间转换。比如,一张场景可以转换为
RGB
全彩图,也
可以转化成素描,也可以转化为灰度图。一张夜景图也可以转化为这个地方的
日景图。本文在
GAN
的基础上提出一个通用的方法:
pix2pixHD
来解决行人
pix2pixhd_基于pix2pixHD的行人图像生成相关推荐
- 【每周CV论文推荐】初学基于GAN的三维图像生成有哪些经典论文需要阅读
欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 当前二维图像生成领域的发展已经非常成熟,但是 ...
- 从DDPM到GLIDE:基于扩散模型的图像生成算法进展
前几天,OpenAI在Arxiv上挂出来了他们最新最强的文本-图像生成GLIDE [1],如头图所示,GLIDE能生成非常真实的结果.GLIDE并非基于对抗生成网络或是VQ-VAE类模型所设计,而是采 ...
- ICCV 2019 | Lifelong GAN:基于持续学习的条件图像生成模型
作者丨薛洁婷 学校丨北京交通大学硕士生 研究方向丨图像翻译 研究动机 持续学习是指希望模型能和人一样能基于过去的先验知识来快速准确的解决当前任务,然而对于人类而言与生俱来的能力对于模型来说却宛如大海捞 ...
- 图像生成之扩散模型:靠加入类别条件,效果直达SOTA
来源:AI蜗牛车 本文约1300字,建议阅读7分钟 比GAN更真实.还懂全景局部多角度构图. OpenAI去年年末推出的新作GLIDE,又让扩散模型小火了一把. 这个基于扩散模型的文本图像生成大模型参 ...
- 图像生成王者不是GAN?扩散模型最近有点火:靠加入类别条件,效果直达SOTA
博雯 发自 凹非寺 量子位 报道 | 公众号 QbitAI OpenAI刚刚推出的年末新作GLIDE,又让扩散模型小火了一把. 这个基于扩散模型的文本图像生成大模型参数规模更小,但生成的图像质量却更高 ...
- CycleGAN非配对图像生成,定制你的卡通照
点击上方"AI搞事情"关注我们 ❝ Paper:<Unpaired Image-to-Image Translation using Cycle-Consistent Adv ...
- 浅谈图像生成模型 Diffusion Model 原理
重磅推荐专栏: <AI 大模型之美> 揭开 ChatGPT 面纱,拥抱 AI 新潮流 重磅推荐专栏: <Transformers自然语言处理系列教程> 手把手带你深入实践Tra ...
- Controlling Style and Semantics in Weakly-Supervised Image Generation(在弱监督图像生成中控制样式和语义)
本篇博客是对论文 Controlling Style and Semantics in Weakly-Supervised Image Generation 的翻译,因本人水平有限,翻译不对的地方还请 ...
- Stable Diffusion - Stable Diffusion WebUI 图像生成工具的环境配置
欢迎关注我的CSDN:https://spike.blog.csdn.net/ 本文地址:https://spike.blog.csdn.net/article/details/131528224 S ...
最新文章
- “天河二号”总工程师杜云飞谈星光超算应用平台设计
- 用机器学习做信用评分
- SQL2005的库能不转成SQL2000的?
- (chap5 web服务器) 保存资源的缓存
- ASP.NET Core Web 应用程序系列(二)- 在ASP.NET Core中使用Autofac替换自带DI进行批量依赖注入(MVC当中应用)...
- ASP.NET Core 导入导出Excel xlsx 文件
- Android逆向笔记-使用Android Studio调试Smali代码(方式一)
- 爱上MVC~业务层刻意抛出异常,全局异常的捕获它并按格式返回
- Kudu报错:你的主机中的软件终止了一个已建立的链接
- vue 属性 computed
- [Objective-C]用Block实现链式编程
- Zend Studio主题的设置
- 2021年下半年软考-网络工程师答案及解析(中级)
- CentOS7部署k8s集群
- 冰箱10分钟启动一次_冰箱正常多久启动一次
- android 日语输入法,Android日语输入法Simeji使用示例
- 上海东方美谷JW万豪、福清喜来登、宁波杭州湾凯悦等酒店开业 | 中国酒店周刊...
- odoo12:上传图片,默认显示图标
- React基础(肆)———状态和循环渲染
- 微信分享获得积分 jquery微信分享获得积分 原理
热门文章
- 计算机科学技术应用任务书,计算机科学与技术专——专业实习任务书.doc
- sequencer和driver
- Spring Cloud Gateway(一)为什么用网关、能做什么、为什么选择Gateway、谓词工厂、过滤器配置
- 【JS组件系列】——表格组件神器:bootstrap table(二:父子表和行列调序)
- python中re.compile_什么是pythonre.compile函数?
- Flutter安装后出现HTTP host not reachable.
- 点击图片实现预览功能
- 【XAI】Comment: Graphical Models, Causality and Intervention
- rational rose 2007安装破解全过程
- 深度学习中的 Batch_Size,以及learning rate参数理解(跑pytorch代码时遇到的问题)