生成图像质量和多样性的评估方法
文章目录
- 定性评估
- 定量评估
- Inception score
- Frechet Inception Distance
- Mode Score
- 1-最近邻双样本检验
- 小结
- 来源
在目前的研究中,对生成图像的质量进行合理地评估主要是从定性评估和定量评估两个方面进行.定性的评估一般在众包平台靠人完成;而定量的评估方法有Inception score、Fréchet Inception Distance、Mode Score等方法.定性的评估方式将在这一节首先被讨论.
定性评估
该方法主要还是靠人的眼睛来进行判断.一般的做法是将真实图像和生成图像对上传到众包平台上让人来判断图像的真假,并且给出两者的相似程度,最后根据打分的结果统计一个最终的指标.
在实践中由于人的主观性是很强的,每个人的标准是不一致的,导致定性评估不是一个通用的标准;视觉检查在评估一个模型对数据的拟合程度时,在低维度数据的情况下可以工作得很好,但是在高维度数据的情况下,这种直觉性可能会导致误导.如图13所示,从标准GAN到最近BIGGAN模型架构的变化,以及生成图像的结果来看,图像生成模型的复杂度和计算量在不断地增加;同时,生成图像的逼真度越来越好,多样性也越来越好.
定量评估
Inception score
Inception score[78](IS)是一种用类概率分布来对生成图像进行评估的方法.该方法使用一个预先在 I m a g e N e t ImageNet ImageNet数据集上训练的 I n c e p t i o n V 3 Inception V3 InceptionV3网络
然后以生成的图像 x x x作为输入,输入分类器,并且输出 p ( y ∣ x ) p(y|x) p(y∣x);
如果一幅生成图像的质量越好,那条件概率分布 p ( y ∣ x ) p(y|x) p(y∣x)的熵就越低,也就意味着分类器以很高的置信度将图像分到某一类。
生成器生成的图像应该具有多样性,因此边缘分布 p ( y ) = ∫ p ( y ∣ x = G ( z ) ) d z p (y)=∫p(y|x=G(z))dz p(y)=∫p(y∣x=G(z))dz应该有很高的熵;基于这样的条件, I S IS IS可以通过下式来计算:
I S = exp ( E x ∼ G ( z ) D K L ( p ( y ∣ x ) ∥ p ( y ) ) ) \mathrm{IS}=\exp \left(E_{x \sim G(z)} D_{\mathrm{KL}}(p(y \mid x) \| p(y)))\right. IS=exp(Ex∼G(z)DKL(p(y∣x)∥p(y)))
式中的E表示计算期望值, D K L D_{KL} DKL表示计算两分布之间的KL散度;
Lucic等人[79]指出Inception score对类标签的先验分布和距离的度量方式都是不敏感的;
由于生成模型只需在每一个类中生成一个质量很好的图像就可以得到高的IS值,因此该方法也面临无法判别模式崩溃的问题.
IS可以展现出生成图像的质量和多样性之间的合理关联,所以该评估指标在实践应用中被广泛采用.
如表4所示,基于ImageNET数据集和CIFAR-10数据集,用定量评估指标Inception Score对多个模型生成的图像的质量和多样性进行了定量计算.可以发现BigGAN模型是当前性能最好的模型,但是通过比较也发现,该评估指标并不适合评估与ImageNET数据集差别较大的图像数据.
总的来讲,Inception Score是用来衡量生成模型个体特征和整体特征的方法.
个体特征指生成的图像要清晰,质量要好.
整体特征指生成的图像要有多样性,即使他们属于同一类别,他们的输出的向量还是应该有差别.
Frechet Inception Distance
Fréchet Inception Distance[80](FID)的基本思想是用Inception网络的卷积特征层作为一个特征函数φ,
并且用特征函数将真实数据分布 P r P_r Pr和生成数据分布 P g P_g Pg建模为两个多元高斯随机变量.
这样就可以计算多元高斯分布的均值 μ x , μ g μ_x,μ_g μx,μg和方差 ∑ x , ∑ g \sum_{x}, \sum_{\mathrm{g}} ∑x,∑g。基于这些信息,生成图像的质量可以通过式(55)由两个高斯分布之间的Fréchet距离来计算.
FID ( X , G ) = ∥ μ x − μ g ∥ 2 2 + Tr ( ∑ x + ∑ g − 2 ( ∑ x ∑ g ) 1 2 ) \begin{aligned} &\operatorname{FID}(X, G)=\left\|\mu_{x}-\mu_{g}\right\|_{2}^{2}+ \operatorname{Tr}\left(\sum_{x}+\sum_{g}-2\left(\sum_{x} \sum_{g}\right)^{\frac{1}{2}}\right) \end{aligned} FID(X,G)=∥μx−μg∥22+Tr⎝⎛x∑+g∑−2(x∑g∑)21⎠⎞
FID度量方式的思想和人类判断是一致的,该评价指标值越小,表示生成的图像越接近真实图像,生成的图片质量越好.
FID和生成图像的质量之间有很强的负相关性; ——
生成图像质量和多样性的评估方法相关推荐
- GAN生成的结果多样性不足怎么办?那就再添一个鉴别器!
AI科技评论按:近期,澳大利亚迪肯大学图像识别和数据分析中心发表了一篇新的论文,由Tu Dinh Nguyen, Trung Le, Hung Vu, Dinh Phung编写,该论文就生成对抗网络( ...
- 对抗生成网络学习(十四)——DRAGAN对模型倒塌问题的处理和生成图像质量评价(tensorflow实现)
一.背景 之前在做GAN主要是关注GAN的应用,找了一些比较好的例子实现了下,后面还会持续做这方面的工作.今天来看看DRAGAN对于GAN中一些问题的处理方法,也为今后这方面的研究做一部分基础工作吧, ...
- Talk | 东京大学博士生刘海洋:多模态驱动谈话动作生成-质量与多样性
本期为TechBeat人工智能社区第471期线上Talk! 北京时间2月1日(周三)20:00,东京大学情报理工系博士生--刘海洋的Talk将准时在TechBeat人工智能社区开播! 他与大家分享的主 ...
- 二元函数图像生成器_GAN生成图像综述
点击上方"CVer",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者:YTimo(PKU EECS) 研究方向:深度学习,计算机 ...
- GAN属于计算机视觉领域嘛_GAN生成图像综述
作者信息: YTimo PKU EECS 研究方向:深度学习,计算机视觉 原创声明:本文为 SIGAI 原创文章,仅供个人学习使用,未经允许,不能用于商业目的. 其它机器学习.深度学习算法的全面系统讲 ...
- yolo-mask的损失函数l包含三部分_【AI初识境】深度学习中常用的损失函数有哪些?...
这是专栏<AI初识境>的第11篇文章.所谓初识,就是对相关技术有基本了解,掌握了基本的使用方法. 今天来说说深度学习中常见的损失函数(loss),覆盖分类,回归任务以及生成对抗网络,有了目 ...
- 「AI初识境」深度学习中常用的损失函数有哪些?
https://www.toutiao.com/a6695152940425937411/ 这是专栏<AI初识境>的第11篇文章.所谓初识,就是对相关技术有基本了解,掌握了基本的使用方法. ...
- 【AI初识境】深度学习中常用的损失函数有哪些?
这是专栏<AI初识境>的第11篇文章.所谓初识,就是对相关技术有基本了解,掌握了基本的使用方法. 今天来说说深度学习中常见的损失函数(loss),覆盖分类,回归任务以及生成对抗网络,有了目 ...
- wgan 不理解 损失函数_AI初识:深度学习中常用的损失函数有哪些?
加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动! 同时提供每月大咖直播分享.真实项目需求对接.干货资讯汇总 ...
最新文章
- Windows 7 PE RAM 引导盘及WIM 镜像制作
- php 当地天气预报,PHP实现采集中国天气网未来7天天气
- 无声息格式化磁盘的API,VB版
- tomcat web.xml配置
- flutter图片点击跳转_使用Flutter之后,我们的CPU占用率降了50%
- linux创建名称为学号的文件,Linux操作系统下用户管理及文件管理.doc
- 智慧发电厂+智能发电厂web端平台管理系统+Axure高保真智慧电厂系统+能耗管理+告警管理+生产监控+安防设备管理+运维设备管理+监控面板+系统管理+智慧电厂+电厂系统+axure源文件+rp原型
- 【Spring】Service 注入失败,空指针
- sql选择题_SQL选择
- 【linux】IP最大可传65535而以太网最大只能传1500问题解析
- 踩过坑才懂:如何快速打造技术产品
- IDEA(或Android Studio)切换Git分支时弹出Git Checkout Problem
- excel max函数的使用
- 中国经济稳中有进态势依旧
- 【离散数学】第一章 命题
- 用于光流估计的无监督深度学习DSTFlow
- http://blog.csdn.net/neiloid/article/details/7037093#
- 高效的六面体变换算法实现(一) —— 等圆柱映射 与 六面体映射(MarkDown编辑器版)
- H264学习二:H.264/AVC编码标准
- c++ eos智能合约开发_EOS开发完全解析(六):手摸手实现第一个EOS智能合约——Hello EOS...