晓查 郭一璞 发自 亚龙湾 
量子位 报道 | 公众号 QbitAI

今天,谷歌发布了最新夜视(Night Sight)功能AI算法。

 图片来自The Verge

你觉得这张照片是在一天之内的什么时候拍的呢?

阴天的傍晚?

乌云蔽日的白天?

看看下面这张“原图”,你就知道了。

 图片来自The Verge

是的,这张照片拍摄于夜晚,用普通模式拍照只能拍出勉强看到的酒杯和水果,在谷歌的夜视模式下,就能像白天一样,所有物品细节一清二楚。

类似的例子还有很多:

 图片来自The Verge

 图片来自The Verge

即使是前置摄像头,也可以拍出不错的效果

 图片来自The Verge

每张样片中,天空的颜色多会由黑色转为阴郁的蓝色,可以说照片效果和白天几乎完全一样,比人眼看到的夜晚更为明亮多彩。

这是因为在非常昏暗的环境下,人类视网膜的视锥细胞停止工作,无法区分不同波长的光,因而只能看到灰暗的场景。

但这并不意味着夜晚只是漆黑一片,谷歌夜视功能一样能看到这些人眼看不到的色彩,也就把夜晚拍的像白天一样明亮。

色泽&清晰度满分

如果你看到这些把夜晚拍成白天的照片,就觉得夜视只是一个“昼夜转换器”,那可大错特错了。

在照片的色泽和清晰度上,谷歌的夜视功能一样敌得过其他旗舰手机。

我们来看看打开夜视功能的谷歌Pixel 3和苹果的iPhone XS Max、华为Mate20,三星Galaxy Note 9拍摄同样景色的对比吧。

谷歌夜视PK iPhone XS Max

第一关,我们先让打开夜视功能的谷歌Pixel 3来和iPhone XS Max对决一下,拍摄晚上送来的披萨外卖。

额……明暗度完全不一样,Pixel 3拍出来色泽鲜亮,披萨上的肉粒清晰,令人食欲大开。

iPhone XS Max拍的披萨过于昏暗了,虽然也可以看到披萨上的肉粒,但受限于昏暗的效果,让人实在没有吃披萨的想法。

相比之下,如此惨状,苹果可以洗洗睡了。

谷歌夜视PK华为Mate 20 Pro

接下来,我们来PK华为Mate 20 Pro。

我们分别用打开夜视功能的Pixel 3和华为Mate 20 Pro来拍摄城市景象。

Pixel 3虽然看起来有点过度锐化,天空处理的并不如Mate 20 Pro柔和,但近处的的光线处理还是更好一些,路灯照亮的部分看起来更亮一些。

谷歌夜视PK三星Galaxy Note 9

接下来的对比对象是三星Galaxy Note 9,我们来拍摄酒吧的画面。

整体看起来差不太多,Galaxy Note 9在暗光下总是无法避免画面偏黄的问题,不过开了夜视功能的Pixel 3就不一样了。

不过,放大看细节,你就会发现Pixel 3拍摄的细节更清晰,酒吧右上角墙上的那个孕妇不要独自喝酒的告示牌上有几行小字,Pixel 3拍摄的照片上,这几行小字清清楚楚,但Note 9嘛,就模糊了很多。

总结来看,打开夜视功能的谷歌Pixel 3已经稳赢iPhone XS Max,小胜三星Galaxy Note 9,和华为Mate 20 Pro各有优劣。

重点是,Pixel 3可是只有一个摄像头啊,另外的三家不是双摄就是三摄,硬件堆的满满。

看来,在拍夜景这件事上,几个摄像头不是最重要的,还得看算法能力。

谷歌的技术储备

其实,谷歌早在2010年就开始研究手机图像的优化算法。在Pixel一代手机问世后,谷歌的拍照“黑科技”一发不可收拾。

都8102年了,谷歌居然还在使用着单摄像头,价格却不输iPhone,这是为什么?当然是对强大算法的自信。

即便是上一代的旗舰机Pixel 2,如今DxO Mark排名也稳居前十:

2014年,谷歌曾推出HDR+技术:通过捕获多帧照片,在软件中并将它们对齐并且合并在一起,拍摄画面明暗反差巨大的图片。

上个月,谷歌又针对Pixel 3手机推出了Super Res Zoom:通过叠加多帧获得超采样照片,可以降低噪点,还能让图像更清晰锐利。

现在谷歌要解决夜景问题当然也不在话下。

夜间成像的难点

低光照条件下,相机面临两种噪点问题:由入射光线涨落导致的散粒噪点,和传感器转换电信号产生的读取噪点。这在镜头和传感器尺寸较小的手机上更为严重。

解决噪点问题有两种方法:合成多张短曝光照片、延长单张照片的曝光时间。

之前提到的HDR+合并多张图片,其主要目的是改善动态范围,用于解决拍照画面中明暗反差巨大的问题。

事实证明,HDR+还可以降低散粒噪点和读取噪点的影响,因此可以改善昏暗光线下的信噪比。

另外,延长曝光时间也是一种解决方案,但它存在两个问题:

首先,Pixel手机上的默认拍照模式使用的是零延时快门:当用户打开相机应用程序,手机就会开始拍摄图像帧并将其存储在缓冲区中,当按下快门时,相机会将最近的9帧或15帧发送到HDR+或Super Res Zoom进行处理。

由于需要在屏幕上实时显示图像以帮助拍照,因此无论场景多么暗淡,HDR+都会将曝光限制在最多66毫秒,从而使取景器能够保持至少每秒15帧的刷新率。

其次,长时间曝光会导致运动模糊,这是由于手抖或场景中物体的移动造成的。光学防抖(OIS)可以延长手持相机的曝光时间(最多约1/8秒),但对于长时间曝光或移动物体无效。

寻找最佳曝光时间

为了对抗光学防抖无法修复的运动模糊,Pixel 3的默认拍照模式使用“运动测量”,其中包括使用光流法(optical flow)测量最近的场景运动,并选择最小化模糊的曝光时间。

如果没有太大的运动,每帧曝光时间将增加到333毫秒。如果相机处于稳定状态,比如靠墙或使用三脚架,则每帧的曝光增加到一秒钟。

除了改变每帧的曝光时间外,谷歌还会改变拍摄的帧数,如果手机放在三脚架上则选取6帧,如果是手持拍摄则最多为15帧。

以下是检测到手持拍摄时的照片:

左图为相机捕获的15帧视频,中图为运动测量关闭时拍摄的图像,右图为开启运动测量拍摄的照片。由于曝光时间更短,所以右图看起来更清晰。

以下是检测到三脚架拍摄时的照片:

左图为手持拍摄,333毫秒曝光×15帧=5秒;右图为三脚架拍摄,1秒曝光×6帧=6秒。可以看出右边图像更清晰,而且能看到更多星星。

最后,谷歌手机会通过HDR+(Pixel一代和二代)或Super Res Zoom(Pixel三代),经过修改和重新调整,将多帧图像合成起来。

夜间白平衡与色彩

除了成像时的噪点和模糊问题,谷歌还面临两大挑战:

低光照条件下白平衡不准

为了解决这些问题,谷歌开发了一种基于学习的自动白平衡(AWB)算法,该算法经过训练以区分白平衡准确或偏移的图像。

当捕获的图像白平衡不准时,算法可以建议如何改变颜色,使照明看起来更中性。

训练此算法需要使用Pixel手机拍摄各种场景,然后在彩色校准显示器上查看照片时手动校正其白平衡。

【算法修正暗光下的白平衡】

光线太暗无法获得准确色调

谷歌在夜视中借鉴了一些画师的技巧,通过S曲线增大夜间图像的对比度。下图展示了采用该方法的效果:

【夜间成像的色彩】

正是因为这些技术,谷歌才敢大胆在旗舰手机上使用单摄像头。不知道还在堆砌4摄的手机厂商感受如何?

年度评选申请

加入社群

量子位AI社群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

宛如白昼,谷歌发布最强夜景拍照AI算法,单摄秒杀一众苹果华为三星相关推荐

  1. 刚刚,英伟达发布最强无人车AI芯片,以及一系列自动驾驶新产品

    夏乙 发自 凹非寺 量子位 出品 | 公众号 QbitAI 英伟达再次带来新"核弹". 在刚刚结束的英伟达发布会上,黄仁勋正式发布了DRIVE Xavier,这是一款为无人车准备的 ...

  2. android 拍照 华为,【华为MateRS保时捷版评测】拍照:徕卡三摄登顶DxOMark名副其实_华为 Mate RS保时捷版_手机评测-中关村在线...

    拍照:徕卡三摄登顶DxOMark名副其实 简单的看下华为MateRS保时捷设计三颗摄像头的配置:4000万像素为主相机,1/1.73英寸彩色感光元件,f/1.8,等效焦距27毫米:2000万像素为副摄 ...

  3. 刷新ImageNet最高分!谷歌发布最强Transformer

    点上方计算机视觉联盟获取更多干货 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:新智元 AI博士笔记系列推荐 周志华<机器学习>手推笔记正式开源!可打印版本附pdf下载链接 近日 ...

  4. 谷歌发布TensorFlow Privacy​:大幅提升AI模型中的隐私保护

    https://www.cnbeta.com/articles/tech/824909.htm 基于机器学习框架TensorFlow的谷歌最新模块,可以让开发者只添加几行额外代码就能改善AI模型中的隐 ...

  5. 谷歌发布Amber项目,用AI分析脑电波诊断治疗抑郁症

    出品|大数据文摘 来源|VB 据世界卫生组织统计,目前世界范围内预计有超过3亿人饱受抑郁症的困扰. 谷歌母公司Alphabet的X LAB刚刚发布了一个被称作"Amber"的项目, ...

  6. 苹果新款笔记本_谷歌发布售价99美元的新款Wi-Fi路由器(全文)_苹果 新款MacBook Pro 13英寸_笔记本新闻...

    早在去年,谷歌就宣布了与 Google Assistant 智能语音助理整合到一起的 Nest 无线路由器.你可将之视作 Wi-Fi 路由器和 Wi-Fi 接入点的二合一,后者配备了与 Nest Mi ...

  7. 未来的苹果和谷歌到底哪家强?

    深度对决,未来的苹果和谷歌到底哪家强?(转) 文/王新喜 日前,前苹果公司CEO约翰·斯卡利称,他认为在科技领域中作出下一个重大创新的很可能不会是苹果公司,而会是谷歌等其他公司.他认为谷歌未来作出重大 ...

  8. 谷歌“验光师”AI算法,让可控核聚变早日成真!

    https://www.toutiao.com/a6656238111980257804/ 2019-02-10 13:23:23 可控核聚变一直是人类追逐的理想.现在,TAE技术公司与谷歌合作,在& ...

  9. 谷歌AI算法 助力可控核聚变研究

    可控核聚变一直是人类追逐的理想.近日,据新智元报道,TAE技术公司与谷歌合作,在"验光师"AI算法的帮助下,让我们有望离这个梦想的实现更近了一些. 核聚变是太阳赖以发光的能量反应. ...

最新文章

  1. [跟我学UML] UML包图中的包和命名空间
  2. linux vg 镜像,Linux下载_Linux系统各种版本ISO镜像下载(redhat,centos,oracle,ubuntu,openSUSE)...
  3. 动态数组怎么定义_Excel VBA 数组基础知识,初学者不可不学的关键知识
  4. android 进程间的通信,Android native进程间通信实例-binder结合共享内存
  5. LIBCLNTSH.SO: WRONG ELF CLASS: ELFCLASS32错误一例
  6. 关于mysql的error-based injection payload
  7. leetcode 78. 子集 思考分析
  8. 前端 html5 css3 框架,UI,分享,CSS3,HTML5,前端框架
  9. Java继承中为什么不可以降低父类重写方法的访问权限
  10. 全向移动机器人参数校准对比及流程分析
  11. android入门问题--R文件丢失
  12. [Cocoa]深入浅出 Cocoa 之消息
  13. dspemif怎么读_DSP技术在EMIF接口中的BOOT方法简析
  14. linux安装硬盘超过2t,linux 硬盘超过2T问题
  15. 保护眼睛颜色的RGB数值
  16. PWmat案例赏析:计算精度高、速度快的第一性原理计算,研究表面终端结构对NV色心影响
  17. vs2015 帮助内容_我在2015年阅读的内容
  18. android通讯录开发二 数据表各字段含义
  19. 游戏光枪坐标定位原理及算法
  20. SC-Lego-LOAM解析(下)

热门文章

  1. 阿里云的工程师要被祭天了?
  2. 第 7 章 排序算法
  3. ubuntu合并终端_技术|初级:如何在终端及图形界面中更新 Ubuntu
  4. azure不支持哪些语句 sql_新同事不讲武德,这SQL语句写得忒野了
  5. linux php和java环境变量配置_java_linux配置java环境变量详细过程,直接上实现过程: 一. 解压安 - phpStudy...
  6. 关联规则完整源代码_接口测试:A06_HttpRunner关联_02_提取 SessionID:固定名称方式...
  7. fpga驱动oled iic显示代码_Arduino提高篇02—OLED屏汉字显示
  8. 引用父类成员的关键字是java_[Java] super关键字:引用父类成员
  9. java jtree 监听_Java JTree.addTreeExpansionListener方法代码示例
  10. angular post php 404,AngularJS POST失败:飞行前响应具有无效的HTTP状态代码404