赞!图像生成PyTorch库火了,涵盖18+ SOTA GAN实现
点上方计算机视觉联盟获取更多干货
仅作学术分享,不代表本公众号立场,侵权联系删除
转载于:机器之心
AI博士笔记系列推荐
周志华《机器学习》手推笔记正式开源!可打印版本附pdf下载链接
近日,在 GitHub 上看到了一个非常有意义的项目 PyTorch-StudioGAN,它是一个 PyTorch 库,提供了条件 / 无条件图像生成的代表性生成对抗网络(GAN)的实现。据主页介绍,该项目旨在提供一个统一的现代 GAN 平台,这样机器学习领域的研究者可以快速地比较和分析新思路和新方法等。
该项目的作者为韩国浦项科技大学的硕士生,他的研究兴趣主要包括深度学习、机器学习和计算机视觉。
项目地址:https://github.com/POSTECH-CVLab/PyTorch-StudioGAN
具体而言,该项目具有以下几个显著特征:
提供了大量 PyTorch 框架的 GAN 实现;
基于 CIFAR 10、Tiny ImageNet 和 ImageNet 数据集的 GAN 基准;
相较原始实现的更好的性能和更低的内存消耗;
提供完全最新 PyTorch 环境的预训练模型;
支持多 GPU(DP、DDP 和多节点 DDP)、混合精度、同步批归一化、LARS、Tensorboard 可视化和其他分析方法。
对于这个 PyTorch GAN 库,有网友表示:「看上去很不错!如果可以提供 top-k 等现代训练实践以及各种增强方法就更棒了。」对此,项目作者称其会在 NeurIPS 论文提交截止日期之后,添加一些改进的方法,如 Sinha 等人的 Tok-K 训练以及 Langevin 采样和 SimCLR 增强。
此外,有网友询问是否可以将该项目用于图像之外的其他领域。作者表示可以,即使无法使用一些稳定器(如 diffaug、ada 等),依然可以通过调整 dataLoader 来训练自己的模型。
18+ SOTA GAN 实现
如下图所示,项目作者提供了 18 + 个 SOTA GAN 的实现,包括 DCGAN、LSGAN、GGAN、WGAN-WC、WGAN-GP、WGAN-DRA、ACGAN、ProjGAN、SNGAN、SAGAN、BigGAN、BigGAN-Deep、CRGAN、ICRGAN、LOGAN、DiffAugGAN、ADAGAN、ContraGAN 和 FreezeD。
cBN:条件批归一化;AC:辅助分类器;PD:Projection 判别器;CL:对比学习。
其中,需要注意以下几点:
G/D_type 表示将标签信息注入生成器或判别式的方式;
EMA 表示生成器中应用更新后的指数移动平均线;
Tiny ImageNet 数据集上的实验使用的是 ResNet 架构而不是 CNN。
下图中 StyleGAN2 为即将实现的 GAN 网络,其中 AdaIN 表示自适应实例归一化(Adaptive Instance Normalization)。
环境要求
Anaconda
Python >= 3.6
6.0.0 <= Pillow <= 7.0.0
scipy == 1.1.0
sklearn
seaborn
h5py
tqdm
torch >= 1.6.0
torchvision >= 0.7.0
tensorboard
5.4.0 <= gcc <= 7.4.0
torchlars
用户可以采用以下方法安装推荐的环境:
conda env create -f environment.yml -n studiogan
在 docker 中还可以采用以下方式:
docker pull mgkang/studiogan:latest
以下是创建名字为「studioGAN」容器的命令,同样也可以使用端口号为 6006 来连接 tensoreboard。
docker run -it --gpus all --shm-size 128g -p 6006:6006 --name studioGAN -v /home/USER:/root/code --workdir /root/code mgkang/studiogan:latest /bin/bash
使用方法
使用 GPU 0 的情况下,在 CONFIG_PATH 中对于模型的训练「-t」和评估「-e」进行了定义:
CUDA_VISIBLE_DEVICES=0 python3 src/main.py -t -e -c CONFIG_PATH
在使用 GPU (0, 1, 2, 3) 和 DataParallel 情况下,在 CONFIG_PATH 中对于模型的训练「-t」和评估「-e」进行了定义:
CUDA_VISIBLE_DEVICES=0,1,2,3 python3 src/main.py -t -e -c CONFIG_PATH
在 python3 src/main.py 程序中查看可用选项,通过 Tensorboard 可以监控 IS、FID、F_beta、Authenticity Accuracies 以及最大奇异值:
~ PyTorch-StudioGAN/logs/RUN_NAME>>> tensorboard --logdir=./ --port PORT
可视化以及分析生成图像
StudioGAN 支持图像可视化、k 最近邻分析、线性差值以及频率分析。所有的结果保存在「./figures/RUN_NAME/*.png」中。
图像可视化的代码和示例如下:
CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -iv -std_stat --standing_step STANDING_STEP -c CONFIG_PATH --checkpoint_folder CHECKPOINT_FOLDER --log_output_path LOG_OUTPUT_PATH
k 最近邻分析,这里固定 K=7,第一列中是生成的图像:
CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -knn -std_stat --standing_step STANDING_STEP -c CONFIG_PATH --checkpoint_folder CHECKPOINT_FOLDER --log_output_path LOG_OUTPUT_PATH
线性插值(仅适用于有条件的 Big ResNet 模型 )的代码和示例如下:
CUDA_VISIBLE_DEVICES=0,...,N python3 src/main.py -itp -std_stat --standing_step STANDING_STEP -c CONFIG_PATH --checkpoint_folder CHECKPOINT_FOLDER --log_output_path LOG_OUTPUT_PATH
参考链接:https://www.reddit.com/r/MachineLearning/comments/lu9gen/p_pytorch_gan_library_that_provides/m
end
我是王博Kings,一名985AI博士,华为云专家/CSDN博客专家,单个AI项目在Github上获得了2000标星,为了方便大家交流,附上了联系方式。
这是我的私人微信,还有少量坑位,可与相关学者研究人员交流学习
目前开设有人工智能、机器学习、计算机视觉、自动驾驶(含SLAM)、Python、求职面经、综合交流群扫描添加CV联盟微信拉你进群,备注:CV联盟
王博Kings 的公众号,欢迎关注,干货多多
王博Kings的系列手推笔记(附高清PDF下载):
博士笔记 | 周志华《机器学习》手推笔记第一章思维导图
博士笔记 | 周志华《机器学习》手推笔记第二章“模型评估与选择”
博士笔记 | 周志华《机器学习》手推笔记第三章“线性模型”
博士笔记 | 周志华《机器学习》手推笔记第四章“决策树”
博士笔记 | 周志华《机器学习》手推笔记第五章“神经网络”
博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(上)
博士笔记 | 周志华《机器学习》手推笔记第六章支持向量机(下)
博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(上)
博士笔记 | 周志华《机器学习》手推笔记第七章贝叶斯分类(下)
博士笔记 | 周志华《机器学习》手推笔记第八章集成学习(上)
博士笔记 | 周志华《机器学习》手推笔记第八章集成学习(下)
博士笔记 | 周志华《机器学习》手推笔记第九章聚类
博士笔记 | 周志华《机器学习》手推笔记第十章降维与度量学习
博士笔记 | 周志华《机器学习》手推笔记第十一章特征选择与稀疏学习
博士笔记 | 周志华《机器学习》手推笔记第十二章计算学习理论(上)
博士笔记 | 周志华《机器学习》手推笔记第十二章计算学习理论(下)
博士笔记 | 周志华《机器学习》手推笔记第十三章半监督学习
博士笔记 | 周志华《机器学习》手推笔记第十四章概率图模型
点个在看支持一下吧
赞!图像生成PyTorch库火了,涵盖18+ SOTA GAN实现相关推荐
- 涵盖18+ SOTA GAN实现,这个图像生成领域的PyTorch库火了
视学算法报道 转载自:机器之心 作者:杜伟.陈萍 GAN 自从被提出后,便迅速受到广泛关注.我们可以将 GAN 分为两类,一类是无条件下的生成:另一类是基于条件信息的生成.近日,来自韩国浦项科技大学的 ...
- 这个图像生成领域的PyTorch库火了,涵盖18+ SOTA GAN实现
点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 机器之心报道 近日,在 GitHub 上看到了一个非常有意义的项目 PyTorch-S ...
- 【视频课】生成对抗网络经典任务,详解基于GAN的图像生成算法!
前言 欢迎大家关注有三AI的视频课程系列,我们的视频课程系列共分为5层境界,内容和学习路线图如下: 第1层:掌握学习算法必要的预备知识,包括Python编程,深度学习基础,数据使用,框架使用. 第2层 ...
- 【论文阅读】A Survey of Image Synthesis Methods for Visual Machine Learning --- 图像生成,计算机视觉
论文原文地址:A Survey of Image Synthesis Methods for Visual Machine Learning ,是对目前image synthesis方法的一个总结和归 ...
- “用于无监督图像生成解耦的正交雅可比正则化”论文解读
Tikhonov regularization terms https://blog.csdn.net/jiejinquanil/article/details/50411617 本文是对博客http ...
- 效果超赞服务器挤爆!用GAN生成人像油画火了,带你一秒回到文艺复兴
鱼羊 栗子 发自 凹非寺 量子位 报道 | 公众号 QbitAI 给GAN一张照片,它就能带你回到文艺复兴,变成一张画像. 不,是,风,格,迁,移.画是GAN自己画的. 你看,穿格子衫的伍迪·艾伦, ...
- 【项目实战课】基于Pytorch的StyleGAN v1人脸图像生成实战
欢迎大家来到我们的项目实战课,本期内容是<基于Pytorch的StyleGAN v1人脸图像生成实战>. 所谓项目实战课,就是以简单的原理回顾+详细的项目实战的模式,针对具体的某一个主题, ...
- 【项目实战课】基于Pytorch的DCGAN人脸嘴部表情图像生成实战
欢迎大家来到我们的项目实战课,本期内容是<基于Pytorch的DCGAN人脸嘴部表情图像生成实战>. 所谓项目实战课,就是以简单的原理回顾+详细的项目实战的模式,针对具体的某一个主题,进行 ...
- 好玩gan_效果超赞服务器挤爆!用GAN生成人像油画火了,带你一秒回到文艺复兴...
好玩的是,即使你输入了一张笑得很开心的照片,AI Portrait Ars也会倾向于让你看上去严肃点. 文 | 鱼羊 栗子 转载自:量子位 (ID:QbitAI) 给GAN一张照片,它就能带你回到文艺 ...
最新文章
- Xamarin图表开发基础教程(2)OxyPlot框架
- tensorflow.python.framework.errors_impl.DataLossError:
- Oracle Redefine table online will clone and exchange source and intermedia table - 3
- MyBatis缓存与Apache Ignite的陷阱
- matplotlib调节colorbar的大小
- 差异性发展 - 浙江工商局长郑宇民“智斗”央视女主持董倩
- 阿里云工程师用机器学习破解雾霾成因
- 【Linux-shell】shell脚本基础语法练习
- 接口幂等性常见的解决方案
- 一些比较好用的网站整站下载工具
- CSDN博客导出chm格式文档
- Testbench的激励添加和书写技巧
- [py] 考拉兹猜想
- (轉貼) 寶蘭開發工具部門將分割成完全獨立的子公司 (C/C++) (News)
- xxxxxxxxxxxxxxxxxxxxxxxxxxxxxcccccccccccc
- 中级经济师人力资源专业
- PCBA方案定制,开发腕式血压计方案
- Functions are not valid as a React child. This may happen if you return a Component instead of 「Comp
- K8S部署Traefik与Ingress、IngressRoute——筑梦之路
- 腾讯云服务器压力测试注意事项
热门文章
- 操作系统考研辅导教程(计算机专业研究生入学考试全真题解) pdf,计算机组成原理考研辅导教程:计算机专业研究生入学考试全真题解...
- java自定义方法使用_Java 自定义方法
- mysql支持arm64架构吗_ARM架构下面安装mysql5.7.22
- centos下python编程工具_CentOS下python的下载及安装
- 美国计算机研究生学校排名2015,2015USNews美国大学研究生计算机工程专业排名
- csv格式清洗与转换python123,Python Pandas 清理错误格式数据
- windows共享文件服务器迁移(NTFS权限,共享权限,磁盘配额迁移)
- aix系统下oracle之ora-00471,Oracle RAC 9.2.0.7 (AIX53,HA52)三台主机实例全down的问题
- python中global的使用_PYTHON中使用GLOBAL引发的一系列问题
- java猜数字代码,我写的猜数字游戏的java代码!