安妮 编译自 Google Research Blog
量子位 出品 | 公众号 QbitAI

昨天,谷歌研究人员提出一种深度CNN——NIMA,它能够预测人类认为哪些图像在技术和美学上看起来还不错。

NIMA与人类感知高度相关,不仅可以用来为图像评分,还能在很多劳动力密集的主观任务中发挥作用,如智能照片编辑、优化视觉质量提升用户参与度、减少图像pipeline中视觉感知的错误等。

在论文NIMA: Neural Image Assessment中,研究人员举了一个打有“天空”标签图像美感评分的例子——

在每张图片下,给出了NIMA评分和groundtruth(括号中分数)。可以看出,NIMA的打分结果与groundtruth相差不大。

图像质量和美感评价

图像质量和美感的量化是图像处理和计算机视觉中的一个问题。

图像质量评价(Image Quality Assessment,IQA)处理的是像素级的退化(degradation)问题,比如噪音、模糊、压缩失真等,美感评价为提取图像中与情感和美感相关的语义层次特征。

通常来说,图像质量评价可被分类为全参考(Full-Reference,FR)和无参考(No-Reference,NR)。

如果用于参考的理想图像可用,则如峰值信噪比(PSNR)、标准-结构相似度(SSIM)等图像质量指标已被开发。当参考图像不可用时,就可用无参考的方法依赖统计模型来预测图像质量。

两种方法的主要目的是预测与人类感知相关的质量分数。在深度CNN图像质量评价方法中,通过在目标分类相关数据集(如ImageNet)上的训练,对初始化权重,之后对带有注释的数据进行微调,完成感知质量评价任务。

NIMA

尽管训练数据中的每个图像都与人类评分的直方图关联,而不是单一的二进制分数,但典型的美学预测方法是将图像分类为低质量和高质量。

评分直方图是衡量图像整体质量的指标,也是评分者之间的协议。在谷歌研究人员的方法中,NIMA模型并没有将图像分类为低/高的分数或回归到平均分,而是为任何给定的图像产生一个分布等级,在1到10的范围内,NIMA给每一个可能的分数赋值。

这与通常获取训练数据的方式一致,在与其他方法对照时,这种方法的结果能更好地预测人类偏好。

NIMA向量分值(如平均值)有很多功能,比如可以用来对照片进行美学排序。

下面显示了由NIMA对AVA数据集的一些图片进行的美学评分,括号中为200个人类的平均打分。经过训练后,NIMA打出的这些照片的美学评分非常接近人类评分员的平均打分。

 NIMA在AVA数据集上对景观标签图像打分,两数值为NIMA评分和ground truth

研究人员发现,NIMA在其他数据集上的表现同样出色,预测的质量分数均接近于人类评分。

NIMA评分也可以用来比较同一主题的图像质量,这些图像可能以不同的方式被扭曲破坏。下面显示的图像是2013年的TID2013测试集的一部分,包含了图像各种类型和级别的失真。

 NIMA预测评分

可以看出,NIMA对模糊、失真图像的打分并不高。

感知图像增强

正如谷歌研究人员在论文Learned Perceptual Image Enhancement中所展示的,质量和美学得分也可以用来在感知上调整图像增强操作。

换句话说,将NIMA评分作为损失函数的一部分,可能会提高图像感知质量。

下图例子表明,NIMA可以作为训练损失调整色调增强算法。可以观察到,根据NIMA评分的对比调整,能够提高审美评分的baseline。因此,NIMA模型能够引导一个深度CNN过滤器寻找美学上接近最优的参数设置,如亮度、高光和阴影等。

 NIMA可以作为训练损失来增强图像/通过训练一个深度CNN和NIMA作为的损失,增强图像的局部色调和对比度

未来发展

研究人员对NIMA的研究表明,基于机器学习的质量评价模型可被广泛应用,比如可以让用户在图库中轻松找到最佳图片,可以通过实时反馈给用户来改进图片等模型可以用来指导增强操作产生更好的结果。

不过,教模型更好地理解什么是质量和美学,还是一个持续且长久的挑战。

相关资料

谷歌研究博客介绍地址:

https://arxiv.org/abs/1712.02864

NIMA: Neural Image Assessment论文地址:

https://arxiv.org/abs/1709.05424

Learned Perceptual Image Enhancement论文地址:

https://arxiv.org/abs/1712.02864

活动报名


加入社群

量子位AI社群12群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot4入群;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进群请加小助手微信号qbitbot4,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。


量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态


谷歌提出深度CNN模型NIMA:帮你挑选清晰且有美感的图片相关推荐

  1. 自回归解码加速64倍,谷歌提出图像合成新模型MaskGIT

    来源:机器之心 本文约2200字,建议阅读5分钟 一种使用双向 transformer 解码器的新型图像合成模型 MaskGIT,在性能和速度上都获得了大幅改进. 来自谷歌研究院的研究者提出了一种使用 ...

  2. 【CVPR 2018】腾讯AI lab提出深度人脸识别中的大间隔余弦损失

    论文导读] 深度卷积神经网络(DCNN)在人脸识别中已经取得了巨大的进展,通常的人脸识别的核心任务都包括人脸验证与人脸识别,涉及到特征判别.很多模型都是使用Softmax损失函数去监督模型的训练,但是 ...

  3. 深度学习模型训练的一般方法(以DSSM为例)

    向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程   公众号:datayx 本文主要用于记录DSSM模型学习期间遇到的问题及分析.处理经验.先统领性地提出深度学习模型训练 ...

  4. 你必须要知道CNN模型:ResNet

    作者:叶 虎 编辑:张   欢 PART 01 ResNet简介 引言 深度残差网络(Deep residual network, ResNet)的提出是CNN图像史上的一件里程碑事件,让我们先看一下 ...

  5. keras入门(三)搭建CNN模型破解网站验证码

    项目介绍   在文章CNN大战验证码中,我们利用TensorFlow搭建了简单的CNN模型来破解某个网站的验证码.验证码如下: 在本文中,我们将会用Keras来搭建一个稍微复杂的CNN模型来破解以上的 ...

  6. 谷歌引入自动网络设计,高效解决大规模深度推荐模型的特征嵌入问题

    来源 | 深度传送门(ID:gh_5faae7b50fc5) 导读:本文主要介绍Google在大规模深度推荐模型上关于特征嵌入的最新论文. 一.背景 大部分的深度学习模型主要包含如下的两大模块:输入模 ...

  7. 谷歌提出「卷积+注意力」新模型,超越ResNet最强变体!

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 丰色 发自 凹非寺 量子位 报道 | 公众号 QbitAI Tran ...

  8. 谷歌提出「卷积+注意力」新模型,超越ResNet最强变体

    丰色 发自 凹非寺 量子位 报道 | 公众号 QbitAI Transformer跨界计算机视觉虽然已取得了一些不错的成绩,但大部分情况下,它还是落后于最先进的卷积网络. 现在,谷歌提出了一个叫做Co ...

  9. 理论与实践中的CNN模型结构,如何引领深度学习热潮

    摘要: 深度学习是指多层神经网络上运用各种机器学习算法解决图像,文本等各种问题的算法集合.卷积神经网络(CNN)是深度学习框架中的一个重要算法,本文介绍了CNN主流模型结构的演进过程,从一切的开始Le ...

最新文章

  1. iOS UIbutton 点击无反应的几种情况
  2. python课程推荐-课程推荐:四天人工智能 python入门体验课
  3. 使用python的docker-py实现docker的api操作
  4. 科目三路考流程及注意事项
  5. Exchange 2010 批量移动邮箱和增加移动请求并发数
  6. java日志记录的5条规则
  7. 深入理解磁盘文件系统之inode
  8. 如何不显示index.php,tp如何隐藏index.php
  9. 消费者性别及其所偏好牛奶品牌频数分布
  10. bat批量修改文件后缀名
  11. xp计算机内存条启动,xp系统出现“xx内存不能为read或written”怎么解决
  12. Redmi 游戏电视 X Pro 评测
  13. 北京站停售站台票引接站者不满 多人强行闯入
  14. cve查询网址(漏洞查询地址)
  15. 医院服务器虚拟化平台,医院虚拟化平台项目建设
  16. 软件工程复习13:软件发布
  17. 利用docker+雨巷云打造私有网盘之安装mysql5.6(1)
  18. 7-1 重要的话说三遍 (5 分)
  19. IMX6ULL的GPIO驱动源码分析
  20. 你也不知道吧?VIVO手机为什么很少出现质量问题?答案意想不到

热门文章

  1. 阿里腾讯的正面交锋:支付宝被薅羊毛 137 万依然乐此不疲
  2. linux下mysql的用户名,linux下设置mysql用户名及密码
  3. php数据库搬家,php 用adodb实现数据库搬家
  4. php关键技术,基于Apache+MySQL+PHP的关键技术分析
  5. 测试环境搭建流程_软件测试流程
  6. java 导出es数据_elasticseach 数据的导出与导出工具elasticdump使用
  7. 信签纸有虚线怎么写_edm邮件营销,专注解决你的开发信难题
  8. kotlin android 镜像,【54】Kotlin android Anko 神兵利器
  9. java native 开发环境搭建_Java3D 集成开发环境部署与配置(含实例)
  10. vacode允许c_使用VS code编译运行C,C++,Java程序