AI手机摄影的三个流派，其中藏了个假AI|AI手机的真与假（一）

在咱们身边，有一个铁打的定律，那就是一个东西或者名称火了，马上就会群起而模仿之。久而久之，这种“微创新”甚至“不用创新”的方式，被国人冠名为“山寨文化”。

互联网领域则更是如此，团购火了能百团大战，O2O火了能全面“开O”，共享经济火了，愣是连男友女友都能“共享”。

山寨得多，就连技术都可以山寨。比如说，去年手机AI刚刚崭露头角，到了今年，全面屏等技术普及之后，AI似乎就成为了各手机厂商普遍希望蹭的热点。

但问题来了，我们知道一块AI移动芯片要承载非常复杂的深度架构，需要几年来部署开发；下围棋的AlphaGo要汇集几十位顶尖科学家的心血，几年迭代才能正式超越人类。

代表了机器智慧向人类接近的AI，难道真的有那么容易吗？

去年音箱大战的时候，有的跟风山寨产品甚至随便搭载个对话系统，连唤醒词都不换就披挂上阵。虽然对话交互这种形式也可以叫做“AI”，但这样的产品真的一点价值都没有。买到的用户只能惊呼：遇到个假的人工智能。

今年，似乎轮到了手机AI遭遇这种奇遇。各厂商纷纷投入AI怀抱成为流行时,假的AI手机似乎也悄然来到了我们身边。

诚然，AI是一个泛概念，不同等级、不同完成度的技术孕育其中。但AI也不应该是一个永远跌落，毫无底线的技术。如果沾边就算的话，茶杯上加个计算合适水温的算法岂不也成了AI设备——问题是这事人类自己就能感觉出来啊。

所以说，AI的真与假，是建立在能给使用者带来哪些实际价值基础上的。有无法被其他技术解决方案替代的价值，或许才是消费者需要的真AI。也只有如此，AI作为一种技术才能持久。

AI手机的真与假，或许也应该有个边界。本尼迪克特·安德森在著名的《想象共同体》中，把极限特征作为框定族群的核心要素。AI手机带给消费者的价值，应该有哪些底线或者说边界呢?

今天开始，我们会用几篇文章，跟大家聊一聊手机AI背后的真实、夸张与谎言。摄影、游戏、视频这些我们耳熟能详的功能背后，一个到底什么是真AI手机的话题正在逐步清晰起来。

而这个话题首当其冲的，当然是AI摄影。

我们知道，识别和感知物理世界，是AI的主要能力。利用AI算法进行影像理解，构成了AI技术的核心组成部分之一——机器视觉。而移植到手机上，AI与摄像头结合，带来摄影体验改变也就变成了手机AI的核心价值。

进入2018的春天，AI摄影近乎成为了每一款新上市手机的关键词。但其实AI是一个非常宽泛的概念，包括林林种种数十个技术体系。

就像同样是邀请朋友去看“水景”，去马尔代夫和去小区健身房看游泳池是绝不一样的。AI也是如此，耗资巨万的AlphaGo和成本几十块钱的语音交互音箱，可能都可以算到AI的体系，但价值之差等若霄壤。

在手机摄影这个领域也是如此，如何实现AI，如何让AI被消费者感受到，目前出现了完全不同的一些思路。今天的AI手机摄影，可以分为三个流派。

流派一：用芯片提供AI摄影通用加速

去年，华为发布了搭载NPU的麒麟970芯片开始，之后苹果也公开了A11仿生神经芯片。从后来华为、荣耀的相关搭载产品，以及苹果iPhoneX来看，基于AI专用芯片来实现手机的AI摄影功能，是这类手机的核心AI能力。

这可以看做是手机AI摄影的第一个流派：芯片派。

华为和荣耀搭载的麒麟970芯片，是世界上首款在CPU、GPU两个通用处理单元之外，加入了AI处理单元NPU（Neural network Processing Unit，神经网络单元）的移动芯片。由于利用了深度学习处理技术，NPU可以比其他处理模式更快地处理卷积、迁移等深度学习任务，也就可以达成更快的AI任务处理能力。根据数据显示，处理相同的AI任务，麒麟970的异构计算架构拥有约 50 倍能效和 25 倍性能的提升，图像识别速度可达到约2000张/分钟，这个记录迄今没有其他芯片打破。

在这之后，苹果也在发布iPhone X时发布了A11芯片，两家不约而同采取了相似的策略。A11集成了一个专用于处理AI任务的运算单元“神经网络引擎(Neural Engine)”，开启了iPhoneX的AI之路。

从底层芯片开始一层层叠加AI处理能力。有两个层面的价值，一是在硬件里完成终端AI计算，可以保证摄像任务的实时性和安全性。毕竟摄影任务上传到云端计算有卡顿可能，断网后无法工作，图片上传服务器面临的数据危险也是显而易见的。

另一方面，芯片派容易被忽略的价值在于对AI摄影任务进行通用加速。比如有的玩法要人脸识别，有的直播要读取动作指令，有的滤镜要搞空间处理，把这些全挤在CPU、GPU上手机马上会进入龟速状态，用云处理无法支持不说，更丧失了实时体验。APP的摄影需求有千千万，目前来看只有在终端有AI处理单元才能满足这些“未知需求”。

说到底，基于芯片的AI摄影到底有哪些体验呢？

华为Mate10、荣耀V10以及iPhone X的能力数据说明，AI摄影可以体现在识别、动作捕捉、光影分析、AR等几个方面。

比如iPhoneX利用A11仿生芯片，可以与结构光传感器、深度陀螺仪进行结合，处理人脸、AR等任务，并可以快速处理图像识别。

而借助麒麟970芯片带来的NPU专项处理能力，荣耀V10、华为mate10等产品可以实现复杂的AI任务加速，从而完成场景识别拍照模式、图像增强与深度处理、AI肖像处理、AI动态捕捉、AI夜拍等任务。包括当下较为少见的图像语义分割功能，通过强计算能力实现对取景器内的画面进行分割处理，进一步实现精准的智慧分区图像处理，相较图像处理App更接近修图师的专业效果。

接下来，荣耀、华为的新产品，以及新一代iPhone必然会继续这条路。而产品和技术先发优势，似乎也在催生AI体验的升级。比如荣耀最早从magic时代就开始积累AI手机的产品经验与训练数据，两年的时间自然形成了对新产品的供养体系。

这个流派的优点在于，用户可以体验到AI的多样化和增长性，手机里不是一成不变的AI体验，而是可以随着生态和技术的发展不断进化。问题是芯片流的门槛很高，需要研发的巨大投入和长达几年的等待周期。

流派二：基于摄像头搞AI

第二个AI手机摄影流派，不能不提到让人爱恨纠葛的谷歌。

众所周知，谷歌是不大力押注硬件技术的，而是在战略上选择强打AI算法优势和云计算强项。这个被谷歌称为AI First的战略，已经体现在谷歌各种穿戴、家庭以及移动设备上，其中pixel系列手机也不例外。

去年推出的谷歌pixel 2，给出了一个非常特别的AI摄影模式，它没有专属的AI芯片，却利用算法和AI图像处理单元完成了动态模糊摄影等摄影能力的补偿。甚至把摄像头切割成非常复杂的成像单元，来供给算法端实现对景深、空间感的AI计算。

这种“吃力不讨好”的方式，大概也只有谷歌会做。背后的核心原因，一方面是谷歌希望用户适应所有数据都上传到谷歌云的生活方式，另一方面也是希望加强AI优势的商业化通道。

谷歌手机的AI秘诀，不在底层芯片里，而是在摄像头区域里藏了一颗专用图像处理协处理器，即ImageProcessing Unit （IPU），专门用来结合云计算与算法集群处理AI拍照与视频任务。

但这样做的问题是图像任务会在专门的部件里处理，并且极大程度依赖云计算。但确实一定程度上绕开了开发芯片的难度，弥补了谷歌硬件上的弱势。这种剑走偏锋，让手机各部件自行AI的思路，有赖于谷歌强绝天下的算法积累，以及云计算处理能力。缺点是：除了谷歌大概没有人可以尝试。

流派三：搞个带算法的APP算了

在手机AI概念火热起来之后，国内手机厂商似乎很快就按耐不住了。雨后春笋版的“AI摄影”字样应运而生，于是也催生了AI摄影的第三个流派：APP派。

所谓APP派很好理解，想一想我们用的各种美颜拍照相机、动态美颜录制应用等等，这些能力，在今天基本都要用到AI算法来实现更好的效果。比如美图秀秀旗下的美图相机，就是在APP里集成了机器学习算法，用来识别拍摄人像和背景、光源间的关系，从而把人像分离出来。

假如把这种基于算法的“AI应用”或者“AI滤镜”，直接搭载到产品摄像头里，说这是AI摄影功能，行不行呢？

好像，大概，可能，也可以吧？

问题是缺少芯片的支持，算法方面也没有技术优势，用户拿到的AI体验可能存疑。

前不久，红米Note5主打了所谓“千元AI双摄”打开了这场关于AI的宣传战序幕。随后vivo X21也以AI摄影能力作为宣传。从产品说明中可见，这两部手机的解决方案基本就是上文所说的“AI滤镜”模式：开发具有一定识别特性的摄影功能，然后在不卡的前提下部署在手机中就可以了。

刚刚发布的小米Mix2S，本质上也是这种解决方案。小米提出的智能场景识别，即在利用图像数据训练处手机对不同景物的识别能力，再在手机相机中初始化搭载“美图相机”之类APP的算法功能，针对不同拍照对象进行针对性修图。

比如机器学习进行人脸和人体轮廓识别，自动进行背景虚化和抠图，以及自动叠加多张照片进行防抖等等。

这类手机的问题，在于芯片和摄像头中缺乏专项处理AI任务的单元，一旦运行高负载的AI任务就需要呼唤云端。而云端的相应速度不够，又导致AI摄影的识别率和准确率下降。

举个例子，处理夜拍效果时，手机需要运用光源捕捉、空间捕捉等AI算法，从而实现夜晚中清晰拍照和光源还原。

而这类APP派假如要加载夜拍类的AI应用就有点尴尬了。因为这类深度学习的负载很大，用传统移动芯片+云计算来跑这类AI拍摄任务，会出现黑夜一层层褪去，半天无法对焦。拍照之后又要上传到云端进行很长时间“处理”，精准度和体验都很差。而一旦没网就更麻烦了。所以我们能看到的是，目前大部分国产手机宣传所谓的AI拍照时，都绝口不提夜拍、动作捕捉等复杂任务。

于是，这个流派中消费者看到的宣传材料里的“AI拍照”，也就变成了整个手机的全部AI能力。其实这些能力弄个不算太差的手机下载个相关APP就可以实现了，单独作为一款产品的主要宣传材料就有点奇怪。

最后，让我们总结一下三个流派的手机AI摄影，到底带给消费者怎样的差别。

芯片派：可以通过终端AI加速，来实现比较高等级的AI摄影任务，比如快速美化、物体识别方案拍照等等。而且通用加速能力和平台接口下放给开发者，更多的拍照应用，比如夜拍、动作抓拍、人脸替换、体态命令等等，必然会陆续加入到用户的手机中。用户相当于购买了持续升级的AI拍照设备。

摄像头派：基于摄像头的AI芯片，应该可以加入更多AI玩法，但是除了谷歌之外，其他开发者是绝对碰不到的。

APP派：抱歉，除了广告语上的1~2个基础AI功能外，别的就不用想了。

三个流派背后手机AI的孰真孰假，也就一目了然了。接下来一篇，我们会聊聊手机游戏上的真假AI。

AI手机摄影的三个流派，其中藏了个假AI|AI手机的真与假（一）相关推荐

ai皮肤检测分数_智能AI皮肤检测仪三步走话术
智能 AI 皮肤检测仪三步走话术第一步:仪器介绍话术: 某某小姐,您好!我们现在用了是德国进口智能 AI 皮肤检测仪给您的皮肤做拍照测试. 我们这台仪器是国外引起的一台专业皮肤定量分析仪器, ...
2017GAITC丨尖峰对话：AI的第三次寒冬会不会到来？
人工智能的概念自1956年在美国达特茅斯会议(Dartmouth Conferences)上被明确提出后,至今已经走过了61年的发展历程.我们站在2017年这个时间点,看到的是人工智能在创投圈的火热, ...
ai无法启动产品_启动AI启动的三个关键教训
ai无法启动产品重点 (Top highlight) Let me be upfront: I was the technical co-founder of an AI startup and i ...
AI端部署“三问”：模型如何跑起来、跑得快、持续跑
关注公众号,发现CV技术之美最近摸鱼期间,发现身为程序员的我被赋予了另一个身份"新生代农民工",简直炸了!重点还官宣了,这就更加实锤了啊!我就想说,我们新生代农民工招谁惹谁了,我 ...
流量卡之家：三个用例可以帮助消除制造商对AI功能的疑虑
在最近一项关于人工智能的制造业实际调查中,44%的汽车和制造业受访者认为AI在未来五年内对制造业的"非常重要",而近49%的人表示是"成功的关键." 制造商实际 ...
AI时代，三步走成为超级个体！
什么是超级个体? 超级个体要同时满足:专业技能+商业变现+脱离依附三大要素--<跃迁>. 言简意赅一点就是具备脱离平台也能生存能力的人.通俗的说就是一个人也能赚钱的人,像职场达人,副业高手 ...
2023年你最值得了解的信息技术-AI篇（三）
41874 深圳市悦保科技有限公司金融企业服务广东省悦保科技全球首个开放宠物垂直领域人工智能平台未融资悦保AI+OCR识别平台,全球首个开放宠物识别.保单识别.医疗票据识别.保险行业单 ...
“AI教父”李开复筹办新公司，掘金 AI 2.0 三个大方向
图片:由无界AI画图工具生成 3月19日,创新工场董事长兼CEO李开复在朋友圈宣布,正在筹组一个名为"Project Al 2.0"的新公司,一个旨在探索AI2.0的创新项目. 图 ...
AI加速（三）| 每条指令都是流水线的工人
大家好啊,我是董董灿. 刚毕业的时候在青岛某信任职,做嵌入式软件开发,需要调试电路板. 公司有个要求是所有新入职的员工,都要去公司自己的加工厂上两周的班,亲自组装生产电路板,体验产品生产的过程. 于是 ...

AI手机摄影的三个流派，其中藏了个假AI|AI手机的真与假（一）

AI手机摄影的三个流派，其中藏了个假AI|AI手机的真与假（一）相关推荐

最新文章

热门文章