鱼羊 发自 凹非寺
量子位 报道 | 公众号 QbitAI

要说现在什么AI技术跟大家伙儿走得最近,那真是非AI特效玩法莫属。

想整张手绘头像,无需点亮绘画技能,拿起手机打开APP拍张照,AI“秒秒钟”帮你自动搞定。

快手“手绘封面”特效

并且早已不仅仅局限于单张照片,短视频的每一帧都能用这样的麻瓜“魔法”丝滑覆盖。

各种艺术风格,只有你想不到,没有AI做不到。

不过,别看这些特效滤镜层出不穷,动不动掀起一波网络狂欢,从一个模型的诞生到它真正走进你的手机,那背后的故事还真不是三言两语就能轻松说完的。

特效是怎么进到手机里的?

不妨以快手爆火的手绘特效为例,详细唠唠这件事。

首先,自然还是算法层面的一系列操作。

从用户拍摄视频/照片,到AI的“手绘作品”输出,在AI看来大致是这样一个流程:

ISP将处理好的视频/照片发送给App,AI接收到需要处理的画面,就会预先对每一帧画面进行预处理,统一格式和尺寸。

接下来,就可以开始侦测并剪切画面中的人脸,运用已经定制好风格的“艺术家”神经网络(如U-Net等)对其进行加工。

这一步生成的手绘效果与输入帧进一步融合之后,手绘特效就初步完成了。

当然,在正式输出之前,每一帧画面还得经过一道化妆和美颜的步骤,来提升整体图像的质量。

这时候可能有盆友会问了,现在各种开源生成算法都很成熟,直接搬到手机里,何难之有啊?

非也非也。

且不说为了最大程度保留用户本人的五官和外形特征,同时兼顾手绘风格的美学和艺术效果,需要在整体风格和局部细节上对AI模型进行更加严苛的调教,对于快手这样的App来说,训练出一个稳定好用的模型往往还只是第一步

更大的困难其实在于手机这个载体本身。

手机作为移动端设备,本身算力有限。也就是说,AI的手绘能力越强大、技术越复杂,对于手机来说,想要流畅不卡顿地运行它,就越困难。

而对于咱用户来说,如果一开特效就是一顿卡卡卡卡卡,电量哐哐掉,那也就没有什么乐趣可言了。

另外,像手绘滤镜这样的算法,默认是在手机CPU上运行的。CPU是一个通用计算单元,本身也并非运行AI工作负载的最佳选择。

怎么解决?大体上有如下三种思路。

第一种思路,还是从算法上着手,对模型进行压缩。以快手为例,AI滤镜背后就都有定制化模型压缩算法的加持,使其可以在考量各种边界条件、有限的计算和内存资源条件下,把模型计算量降到最低。

不过再怎么在算法上优化,硬件层面的限制仍然是无法绕开的问题。

于是就有了第二种思路,上云。许多App提供商都会选择在云端进行复杂的AI处理,以解决移动端算力不足带来的挑战。

但这又引发了新的问题——在云端计算,就会受到网络环境的影响,导致额外的时延和其他变化,也没有办法满足离线需要。

所以第三种思路,就是直接从SoC硬件厂商这一侧解决问题。

以最常见的高通骁龙移动平台为例,其搭载的高通AI引擎,就在硬件这一侧,实现了AI计算的加速。

高通AI引擎有啥不一样?

高通AI引擎,其实就是内置于骁龙移动平台的一套完整软硬件AI解决方案。

在硬件方面,高通AI引擎采用多核异构计算方案,包含:

  • Hexagon向量处理器

  • Adreno GPU

  • Kryo CPU

因此,通过智能调度CPU、GPU和向量处理器来进行AI运算,高通AI引擎能充分发挥出不同架构处理器的优点,在实现高算力的同时,最大限度保证能效。

而在软件方面,高通AI引擎的软件工具包括:骁龙神经处理SDK、Android NN和Hexagon NN。利用这些软件工具,像视频平台这样的算法开发方,就能够快速接入高通AI引擎,充分探索AI算法的性能边界。

事实上,快手和高通早在骁龙765移动平台推出时就展开了合作。针对App在移动平台的性能、功耗、扩展性和兼容性等方面的需求,高通神经处理SDK能够以软件的方式提供支持,并释放CPU工作负载,通过Hexagon处理器来实现AI加速。并且,双方还在模型量化压缩方面开展了合作,在提升模型性能和能效的同时,确保AI处理的精确度。

由此带来的效果可以直接用一组数据体现:手绘滤镜帧率(FPS)提升56%,功耗降低32%

而在今年,随着新一代骁龙778G移动平台的推出,双方的合作还在进一步加深。核心围绕的,就是第6代高通AI引擎

骁龙778G支持的第6代高通AI引擎包含高通Hexagon 770处理器,算力可达12TOPS,性能较前代平台实现翻番。为便于大家参照:苹果A14为11TOPS。

此外,骁龙778G采用的全新Qualcomm Spectra ISP,支持每秒处理20亿像素,能够为高通AI引擎运行特效算法提供额外加持。

快手Y-tech AI工程组负责人边红昌针对这项合作,还表示:

与高通技术公司的出色合作帮助快手突破了AI算法的性能边界。我们很高兴能够与高通继续协作,充分发挥骁龙高端芯片的强大异构计算能力。通过增强神经网络性能并提升输出质量,我们将能为用户提供更具吸引力的应用和更高价值。”

“AI大厂”高通?

说起高通,或许你的印象还停留在“一家手机芯片厂”,长于游戏和图形。

但从手绘滤镜这个案例中,就不难看出,其实高通早已是一家AI大厂,还是App开发商们乐于携手合作的那种。

事实上,早在AI方兴未艾之时,高通就已经将AI视为技术发展的重点。

在2007年,高通旗下的Qualcomm Research就启动了首个人工智能项目,并于2018年正式成立Qualcomm AI Research。

2015年,搭载第一代高通AI引擎的骁龙820发布,正式引入高通Hexagon向量扩展内核,以支持更强大的AI处理能力。

在历经6年的逐年迭代之后,今年同样搭载第6代高通AI引擎的骁龙888 Plus,已经实现了高达32 TOPS的强大算力。

并且,高通的AI能力或许也比你想象的更深入日常生活。

虽然不像App里的AI特效算法那样让人感知强烈,但你的手机、手机应用越来越智能背后,或多或少都有高通AI引擎的影子。

最近就有新例子——

搭载了骁龙888系列的荣耀Magic 3,通过场景元素识别和智能匹配、推荐,实现AI影调推荐功能,让用户在手机上也能拍出电影大片的质感。

而同样搭载了骁龙888 Plus的小米MIX4,惊艳的屏下摄像头落地背后,少不了AI图像增强算法的加持;更有全景AI翻译新玩法,带来同声传译、屏幕翻译、拍照翻译、AI字幕等实用AI功能,让用户能在刷视频、线上会议等诸多场景中,都方便体验到AI“翻译大师”的服务……

黑科技有多复杂?那不是大多数用户需要考虑的。

但在高通与其合作厂商的碰撞中,更多的黑科技正在成为生活的常态。

拿来就完事了,你说呢(手动狗头)?

没想到吧,让你一秒变身纸片人的爆火AI特效,背后还有这么多知识点相关推荐

  1. 拼多多面试官没想到ThreadLocal我用得这么溜,人直接傻掉

    点赞再看,养成习惯,微信搜一搜[敖丙]关注这个互联网苟且偷生的程序员. 本文 GitHub https://github.com/JavaFamily 已收录,有一线大厂面试完整考点.资料以及我的系列 ...

  2. 美团运维面试官没想到jenkins我用得这么溜,人直接傻掉

    前言 春天来了,在家玩了半年,也该出去散散心了,顺便收获几个offer练练手,要不然都没有办法给小伙伴们发面试题了. 所谓知己知彼方能百战不殆,我先是在网上搜索了一下关于最近的运维职位,发现还行,大多 ...

  3. 被信任的感觉,我是真的没想到。。

    是这样的,昨天发布了技术人的五层楼这篇文章之后,目前是半价也就是五折.光昨晚一会会续费的高达 40 多位,同时又有了新入坑的球友.我都不知道说啥了,今年白天续费了高达二十多位球友.总之,说实话,我是真 ...

  4. 万万没想到,坤坤洗白的第一步是周琦…

    前晚(2日)中国男篮与波兰队的关键一战惜败后,几乎所有中国球迷都在哭"琦","琦"到一夜未眠. 周琦关键时刻边线发球失误,硬生生把中国男篮提前出线的jio给拖了 ...

  5. 2015年第21本:万万没想到,用理工科思维理解世界

    <万万没想到:用理工科思维理解世界>这本书好像是从amazon排行榜中发现的,先是下载了电子版,竟然是一个博客(学而时嘻之)的大合集,可能是网上的某人用作者的博客制作而成的,共有123章! ...

  6. 我的世界java版游戏崩溃_我的世界:MC不一样的冷知识,游戏崩溃?没想到你是这样的F3!...

    我的世界:MC不一样的冷知识,游戏崩溃?没想到你是这样的F3!我的世界:超实用的5大快捷操作,这个键按住10秒会发生神奇的事! 快捷操作一:拿起和放置物品 <我的世界>早期没有合成书的时候 ...

  7. 造了一个 Redis 分布锁的轮子,没想到还学到这么多东西!!!

    手撸分布式锁 这篇文章本来是准备写下 Mysql 查询左匹配的问题,但是还没研究出来.那就先写下最近在鼓捣一个东西,使用 Redis 实现可重入分布锁. 看到这里,有的朋友可能会提出来使用 redis ...

  8. 我知道有中年危机,但没想到这么不堪

    来源 | 燃次元(ID:chaintruth) 作者 | 曹阳 编辑 | 林文龙 "金三银四"是职场人的黄金跳槽时间,但赵华正在被职场排挤,面临失业. 35岁的赵华,在半年前加入了 ...

  9. 表格中建一个按钮_没想到手机还有扫描功能,纸质表格一键电子化,看完快去试试...

    当我们在生活中或者工作中,需要把书面上的表格变成电子档,也许很多人都会对照着表格手动制作,这样就太浪费时间了. 其实在我们的手机中就有扫描功能,可以一键将纸质表格变成电子档,这样可以省去大量时间,大大 ...

最新文章

  1. 线性代数:03 向量空间 -- 基本概念
  2. Redis 日志篇:无畏宕机快速恢复的杀手锏
  3. 2018年全球5G的12大趋势
  4. Leetcode 134. 加油站 解题思路及C++实现
  5. csv 字符串_python3从零学习-5.5.1、CSV 文件读写
  6. Java集合之Hashtable源码分析
  7. java.lang.StackOverflowError递归的栈溢出错误
  8. 开箱即用~基于.NET Core的统一应用逻辑分层框架设计
  9. ubuntu安装zookeeper和kafka
  10. AS 3.0 socket 通信,比较基础比较全【转载】
  11. 系统crontab指令
  12. python解释器错误
  13. 微信小程序前端登录模块设计
  14. 正态分布及其概率计算
  15. 看看北京生活有多好……
  16. “ 流量or变现 “ 网销50条干货必备
  17. evernote印象笔记导出的enex文件转换markdown文档
  18. 利用Python在网上接单,兼职也能月薪过万,真的假的?
  19. fullcalendar的使用教程
  20. ipvs命令~创建VS/DR模式集群

热门文章

  1. PostgreSQL可视化客户端工具
  2. Native与H5交互的那些事
  3. solr的安装配置与helloworld
  4. 【算法与数据结构】B-树学习笔记
  5. 1. Action 实现 ModelDriven 接口后的运行流程
  6. JavaScript 中的return true 和return false
  7. html中 主标题与副标题,wordpress首页SEO:让主标题+副标题作为页面title
  8. 允许使用抽象类类型 isearchboxinfo 的对象_final关键字、抽象类以及接口
  9. 数据库学习day_03:关联关系/ 关联查询/ JDBC
  10. Kali Linux快速切换root用户