在咱们身边,有一个铁打的定律,那就是一个东西或者名称火了,马上就会群起而模仿之。久而久之,这种“微创新”甚至“不用创新”的方式,被国人冠名为“山寨文化”。

互联网领域则更是如此,团购火了能百团大战,O2O火了能全面“开O”,共享经济火了,愣是连男友女友都能“共享”。

山寨得多,就连技术都可以山寨。比如说,去年手机AI刚刚崭露头角,到了今年,全面屏等技术普及之后,AI似乎就成为了各手机厂商普遍希望蹭的热点。

但问题来了,我们知道一块AI移动芯片要承载非常复杂的深度架构,需要几年来部署开发;下围棋的AlphaGo要汇集几十位顶尖科学家的心血,几年迭代才能正式超越人类。

代表了机器智慧向人类接近的AI,难道真的有那么容易吗?

去年音箱大战的时候,有的跟风山寨产品甚至随便搭载个对话系统,连唤醒词都不换就披挂上阵。虽然对话交互这种形式也可以叫做“AI”,但这样的产品真的一点价值都没有。买到的用户只能惊呼:遇到个假的人工智能。

今年,似乎轮到了手机AI遭遇这种奇遇。各厂商纷纷投入AI怀抱成为流行时,假的AI手机似乎也悄然来到了我们身边。

诚然,AI是一个泛概念,不同等级、不同完成度的技术孕育其中。但AI也不应该是一个永远跌落,毫无底线的技术。如果沾边就算的话,茶杯上加个计算合适水温的算法岂不也成了AI设备——问题是这事人类自己就能感觉出来啊。

所以说,AI的真与假,是建立在能给使用者带来哪些实际价值基础上的。有无法被其他技术解决方案替代的价值,或许才是消费者需要的真AI。也只有如此,AI作为一种技术才能持久。

AI手机的真与假,或许也应该有个边界。本尼迪克特·安德森在著名的《想象共同体》中,把极限特征作为框定族群的核心要素。AI手机带给消费者的价值,应该有哪些底线或者说边界呢?

今天开始,我们会用几篇文章,跟大家聊一聊手机AI背后的真实、夸张与谎言。摄影、游戏、视频这些我们耳熟能详的功能背后,一个到底什么是真AI手机的话题正在逐步清晰起来。


而这个话题首当其冲的,当然是AI摄影。

我们知道,识别和感知物理世界, 是AI的主要能力。利用AI算法进行影像理解,构成了AI技术的核心组成部分之一——机器视觉。而移植到手机上,AI与摄像头结合,带来摄影体验改变也就变成了手机AI的核心价值。

进入2018的春天,AI摄影近乎成为了每一款新上市手机的关键词。但其实AI是一个非常宽泛的概念,包括林林种种数十个技术体系。

就像同样是邀请朋友去看“水景”,去马尔代夫和去小区健身房看游泳池是绝不一样的。AI也是如此,耗资巨万的AlphaGo和成本几十块钱的语音交互音箱,可能都可以算到AI的体系,但价值之差等若霄壤。

在手机摄影这个领域也是如此,如何实现AI,如何让AI被消费者感受到,目前出现了完全不同的一些思路。今天的AI手机摄影,可以分为三个流派。

流派一:用芯片提供AI摄影通用加速

去年,华为发布了搭载NPU的麒麟970芯片开始,之后苹果也公开了A11仿生神经芯片。从后来华为、荣耀的相关搭载产品,以及苹果iPhoneX来看,基于AI专用芯片来实现手机的AI摄影功能,是这类手机的核心AI能力。

这可以看做是手机AI摄影的第一个流派:芯片派。

华为和荣耀搭载的麒麟970芯片,是世界上首款在CPU、GPU两个通用处理单元之外,加入了AI处理单元NPU(Neural network Processing Unit,神经网络单元)的移动芯片。由于利用了深度学习处理技术,NPU可以比其他处理模式更快地处理卷积、迁移等深度学习任务,也就可以达成更快的AI任务处理能力。根据数据显示,处理相同的AI任务,麒麟970的异构计算架构拥有约 50 倍能效和 25 倍性能的提升,图像识别速度可达到约2000张/分钟,这个记录迄今没有其他芯片打破。

在这之后,苹果也在发布iPhone X时发布了A11芯片,两家不约而同采取了相似的策略。A11集成了一个专用于处理AI任务的运算单元“神经网络引擎(Neural Engine)”,开启了iPhoneX的AI之路。

从底层芯片开始一层层叠加AI处理能力。有两个层面的价值,一是在硬件里完成终端AI计算,可以保证摄像任务的实时性和安全性。毕竟摄影任务上传到云端计算有卡顿可能,断网后无法工作,图片上传服务器面临的数据危险也是显而易见的。

另一方面,芯片派容易被忽略的价值在于对AI摄影任务进行通用加速。比如有的玩法要人脸识别,有的直播要读取动作指令,有的滤镜要搞空间处理,把这些全挤在CPU、GPU上手机马上会进入龟速状态,用云处理无法支持不说,更丧失了实时体验。APP的摄影需求有千千万,目前来看只有在终端有AI处理单元才能满足这些“未知需求”。

说到底,基于芯片的AI摄影到底有哪些体验呢?

华为Mate10、荣耀V10以及iPhone X的能力数据说明,AI摄影可以体现在识别、动作捕捉、光影分析、AR等几个方面。

比如iPhoneX利用A11仿生芯片,可以与结构光传感器、深度陀螺仪进行结合,处理人脸、AR等任务,并可以快速处理图像识别。


而借助麒麟970芯片带来的NPU专项处理能力,荣耀V10、华为mate10等产品可以实现复杂的AI任务加速,从而完成场景识别拍照模式、图像增强与深度处理、AI肖像处理、AI动态捕捉、AI夜拍等任务。包括当下较为少见的图像语义分割功能,通过强计算能力实现对取景器内的画面进行分割处理,进一步实现精准的智慧分区图像处理,相较图像处理App更接近修图师的专业效果。

接下来,荣耀、华为的新产品,以及新一代iPhone必然会继续这条路。而产品和技术先发优势,似乎也在催生AI体验的升级。比如荣耀最早从magic时代就开始积累AI手机的产品经验与训练数据,两年的时间自然形成了对新产品的供养体系。

这个流派的优点在于,用户可以体验到AI的多样化和增长性,手机里不是一成不变的AI体验,而是可以随着生态和技术的发展不断进化。问题是芯片流的门槛很高,需要研发的巨大投入和长达几年的等待周期。

流派二:基于摄像头搞AI

第二个AI手机摄影流派,不能不提到让人爱恨纠葛的谷歌。

众所周知,谷歌是不大力押注硬件技术的,而是在战略上选择强打AI算法优势和云计算强项。这个被谷歌称为AI First的战略,已经体现在谷歌各种穿戴、家庭以及移动设备上,其中pixel系列手机也不例外。

去年推出的谷歌pixel 2,给出了一个非常特别的AI摄影模式,它没有专属的AI芯片,却利用算法和AI图像处理单元完成了动态模糊摄影等摄影能力的补偿。甚至把摄像头切割成非常复杂的成像单元,来供给算法端实现对景深、空间感的AI计算。

这种“吃力不讨好”的方式,大概也只有谷歌会做。背后的核心原因,一方面是谷歌希望用户适应所有数据都上传到谷歌云的生活方式,另一方面也是希望加强AI优势的商业化通道。


谷歌手机的AI秘诀,不在底层芯片里,而是在摄像头区域里藏了一颗专用图像处理协处理器,即ImageProcessing Unit (IPU),专门用来结合云计算与算法集群处理AI拍照与视频任务。

但这样做的问题是图像任务会在专门的部件里处理,并且极大程度依赖云计算。但确实一定程度上绕开了开发芯片的难度,弥补了谷歌硬件上的弱势。这种剑走偏锋,让手机各部件自行AI的思路,有赖于谷歌强绝天下的算法积累,以及云计算处理能力。缺点是:除了谷歌大概没有人可以尝试。

流派三:搞个带算法的APP算了

在手机AI概念火热起来之后,国内手机厂商似乎很快就按耐不住了。雨后春笋版的“AI摄影”字样应运而生,于是也催生了AI摄影的第三个流派:APP派。

所谓APP派很好理解,想一想我们用的各种美颜拍照相机、动态美颜录制应用等等,这些能力,在今天基本都要用到AI算法来实现更好的效果。比如美图秀秀旗下的美图相机,就是在APP里集成了机器学习算法,用来识别拍摄人像和背景、光源间的关系,从而把人像分离出来。

假如把这种基于算法的“AI应用”或者“AI滤镜”,直接搭载到产品摄像头里,说这是AI摄影功能,行不行呢?

好像,大概,可能,也可以吧?

问题是缺少芯片的支持,算法方面也没有技术优势,用户拿到的AI体验可能存疑。

前不久,红米Note5主打了所谓“千元AI双摄”打开了这场关于AI的宣传战序幕。随后vivo X21也以AI摄影能力作为宣传。从产品说明中可见,这两部手机的解决方案基本就是上文所说的“AI滤镜”模式:开发具有一定识别特性的摄影功能,然后在不卡的前提下部署在手机中就可以了。

刚刚发布的小米Mix2S,本质上也是这种解决方案。小米提出的智能场景识别,即在利用图像数据训练处手机对不同景物的识别能力,再在手机相机中初始化搭载“美图相机”之类APP的算法功能,针对不同拍照对象进行针对性修图。

比如机器学习进行人脸和人体轮廓识别,自动进行背景虚化和抠图,以及自动叠加多张照片进行防抖等等。

这类手机的问题,在于芯片和摄像头中缺乏专项处理AI任务的单元,一旦运行高负载的AI任务就需要呼唤云端。而云端的相应速度不够,又导致AI摄影的识别率和准确率下降。

举个例子,处理夜拍效果时,手机需要运用光源捕捉、空间捕捉等AI算法,从而实现夜晚中清晰拍照和光源还原。

而这类APP派假如要加载夜拍类的AI应用就有点尴尬了。因为这类深度学习的负载很大,用传统移动芯片+云计算来跑这类AI拍摄任务,会出现黑夜一层层褪去,半天无法对焦。拍照之后又要上传到云端进行很长时间“处理”,精准度和体验都很差。而一旦没网就更麻烦了。所以我们能看到的是,目前大部分国产手机宣传所谓的AI拍照时,都绝口不提夜拍、动作捕捉等复杂任务。

于是,这个流派中消费者看到的宣传材料里的“AI拍照”,也就变成了整个手机的全部AI能力。其实这些能力弄个不算太差的手机下载个相关APP就可以实现了,单独作为一款产品的主要宣传材料就有点奇怪。

最后,让我们总结一下三个流派的手机AI摄影,到底带给消费者怎样的差别。

芯片派:可以通过终端AI加速,来实现比较高等级的AI摄影任务,比如快速美化、物体识别方案拍照等等。而且通用加速能力和平台接口下放给开发者,更多的拍照应用,比如夜拍、动作抓拍、人脸替换、体态命令等等,必然会陆续加入到用户的手机中。用户相当于购买了持续升级的AI拍照设备。

摄像头派:基于摄像头的AI芯片,应该可以加入更多AI玩法,但是除了谷歌之外,其他开发者是绝对碰不到的。

APP派:抱歉,除了广告语上的1~2个基础AI功能外,别的就不用想了。

三个流派背后手机AI的孰真孰假,也就一目了然了。接下来一篇,我们会聊聊手机游戏上的真假AI。

AI手机摄影的三个流派,其中藏了个假AI|AI手机的真与假(一)相关推荐

  1. ai皮肤检测分数_智能AI皮肤检测仪三步走话术

    智能 AI 皮肤检测仪三步走话术 第一步:仪器介绍 话术: 某某小姐,您好!我们现在用了是 德国进口智能 AI 皮肤检测仪 给您的皮肤做拍照 测试. 我们这台仪器是国外引起的一台专业皮肤定量分析仪器, ...

  2. 2017GAITC丨尖峰对话:AI的第三次寒冬会不会到来?

    人工智能的概念自1956年在美国达特茅斯会议(Dartmouth Conferences)上被明确提出后,至今已经走过了61年的发展历程.我们站在2017年这个时间点,看到的是人工智能在创投圈的火热, ...

  3. ai无法启动产品_启动AI启动的三个关键教训

    ai无法启动产品 重点 (Top highlight) Let me be upfront: I was the technical co-founder of an AI startup and i ...

  4. AI端部署“三问”:模型如何跑起来、跑得快、持续跑

    关注公众号,发现CV技术之美 最近摸鱼期间,发现身为程序员的我被赋予了另一个身份"新生代农民工",简直炸了!重点还官宣了,这就更加实锤了啊!我就想说,我们新生代农民工招谁惹谁了,我 ...

  5. 流量卡之家:三个用例可以帮助消除制造商对AI功能的疑虑

    在最近一项关于人工智能的制造业实际调查中,44%的汽车和制造业受访者认为AI在未来五年内对制造业的"非常重要",而近49%的人表示是"成功的关键." 制造商实际 ...

  6. AI时代,三步走成为超级个体!

    什么是超级个体? 超级个体要同时满足:专业技能+商业变现+脱离依附三大要素--<跃迁>. 言简意赅一点就是具备脱离平台也能生存能力的人.通俗的说就是一个人也能赚钱的人,像职场达人,副业高手 ...

  7. 2023年你最值得了解的信息技术-AI篇(三)

    41874 深圳市悦保科技有限公司 金融  企业服务 广东省 悦保科技 全球首个开放宠物垂直领域人工智能平台 未融资 悦保AI+OCR识别平台,全球首个开放宠物识别.保单识别.医疗票据识别.保险行业单 ...

  8. “AI教父”李开复筹办新公司,掘金 AI 2.0 三个大方向

    图片:由无界AI画图工具生成 3月19日,创新工场董事长兼CEO李开复在朋友圈宣布,正在筹组一个名为"Project Al 2.0"的新公司,一个旨在探索AI2.0的创新项目. 图 ...

  9. AI加速(三)| 每条指令都是流水线的工人

    大家好啊,我是董董灿. 刚毕业的时候在青岛某信任职,做嵌入式软件开发,需要调试电路板. 公司有个要求是所有新入职的员工,都要去公司自己的加工厂上两周的班,亲自组装生产电路板,体验产品生产的过程. 于是 ...

最新文章

  1. jenkins android sdk,Jenkins为什么找不到Android SDK?
  2. spark如何防止内存溢出_Spark 理论基石 —— RDD
  3. 重学java基础第四课:关于教育和对大家的期望
  4. 2018年12月精选文章目录一览
  5. POJ 2185 Milking Grid (KMP,GCD)
  6. LeetCode 题练习记录
  7. uni-app在h5端和app端的使用。/deep/ css兼容性问题如何解决?
  8. H5在微信下载app
  9. 浅论汽车电子行业的汽车开放系统架构AUTOSAR
  10. 基于matlab的车牌定位算法设计与实现,原创】基于matlab的汽车牌照识别系统设计与实现...
  11. 互不联网“拆墙”之后的新私域红利——许远东在第63届直播新零售千人峰会发言
  12. elasticsearch + ik
  13. [面试] 各大IT公司校园招聘程序猿笔试、面试题集锦
  14. ES5 Array新方法reduce()  数组累加
  15. 清理异常值(MAD:绝对中位差)
  16. 载波聚合mac_Lte-a终端测试仪表在载波聚合下mac层数据调度方法
  17. SeekBarVolumizer.java
  18. js时间戳转时间年月日时分秒
  19. 深析C语言的灵魂 -- 指针
  20. FAR planner浅尝试

热门文章

  1. Jenkins自动化部署Vue项目
  2. 万取一收——三品民家法书展征稿启事
  3. 用Win32写的定时关机程序
  4. 如何把你的蓝牙耳机同时同地给两台不同的设备使用
  5. Android 读取手机文件夹向指定文件夹下存放
  6. 【直播回顾】企业如何在Q1开启新征程?教你巧用企业邮箱,打造公司管理运营新面貌
  7. Hessian原理分析
  8. mac下安装powerline美化终端窗口
  9. 中了勒索病毒你就惨了
  10. Mysql之mysqladmin工具