萧箫 发自 凹非寺
量子位 报道 | 公众号 QbitAI

一顿操作后,需要实时模糊背景的视频,看起来流畅了不少:

实时目标检测的延迟也更低了:

这是谷歌特意为移动设备Web端开发的一系列新工具,可以在几乎不影响AI模型推理准确性的同时,“修剪”模型大小,以提升模型推理速度。

最好的情况下,能将AI模型的推理速度提升2倍,模型大小“缩水”一半。

这是怎么做到的?

“抽掉”部分网络权重

这一过程,利用了AI、机器学习模型的稀疏性

稀疏性,指在神经网络模型中,可以将部分网络的权重设置为0,以加快推理速度。

它的实现过程,有点像是玩只抽走积木的叠叠乐游戏。

用户要在保证模型不会“坍塌”的同时,抽走部分参数(将参数设置为0)。

这是因为,AI模型在进行推理任务时,往往涉及大量矩阵乘法运算。

如果能在不影响推理结果的同时,将矩阵中的部分参数设置成0,就能极大地加快矩阵运算速度,缩短推理时间。

目前,许多移动端的轻量级神经网络架构,如MobileNet和EfficientNetLite,主要由深度可分离卷积和1×1卷积组成。

其中1×1卷积耗费的推理时间最多,占总计算量的65%以上。

在MobileNet中,1×1卷积的计算量甚至占模型总推理时间的85%

因此,1×1卷积层成为了稀疏化的最优选择。

TensofFlow Lite可用

此前,这种利用稀疏性加速推理的方法,应用范围并不广泛。

一个原因,是神经网络本身难以解释,导致稀疏化的过程也不好解释,以至于缺乏稀疏化的工具。

另一个原因,则是相应设备如手机,缺乏对稀疏化操作的支持。

现在,谷歌特意为移动设备和Web端,发布了一系列针对TensorFlow Lite、和XNNPACK浮点加速库的稀疏化新工具。

利用这些稀疏化工具,神经网络就能变得更高效,用户也能快速上手。

其中,XNNPACK库包含了能检测模型是否稀疏的方法,TF Lite工具包中则包含基于幅度的修剪、或RigL等让模型“缩水”的方法。

整体稀疏化的过程如下:

  • 首先,从原始模型开始训练,在过程中逐渐将网络中的部分权重设置为0,即“修剪”模型。

  • 然后,通过适当增加训练时间,提升模型准确度(不会比修剪前的模型差太多)。

  • 最后,获得的稀疏AI推理模型,可以以压缩格式有效存储,比原始模型要更小。

这个工具支持一系列感知算法模型,包括MediaPipe的手部跟踪模型:

以及Google Meet中的背景替换模型:

当然,除了谷歌自带的AI模型以外,这些稀疏化工具也可以用在自己设计的AI模型中。

具体效果如何呢?

推理速度快2倍

下图是原始模型和稀疏模型的对比。

其中,蓝色和黄色,分别对应原始模型的32帧/秒、和16帧/秒的模型大小,红色和绿色则是稀疏模型对应的大小。

从图中可以看见,经过“修剪”的AI模型,无论是“手部跟踪”、还是“背景替换”,模型大小都降低了接近一半以上。

而且,随着稀疏程度的提高,推理时间也几乎呈直线下降趋势。

但也要注意,不能一味地稀疏化模型,因为当模型的稀疏化程度高于70%的时候,模型的精度就会出现明显的下降。

因此,模型的实际稀疏效果,还是会和理论上有所出入。

在实际应用上,Google Meet推理时间只降低了30%,但也已经非常不错了。

还在发愁自己的AI模型太大,在移动设备中运行效果不好的小伙伴,可以试着将自己的模型“缩缩水”了~

项目地址:
https://github.com/tensorflow/tensorflow/blob/master/tensorflow/lite/delegates/xnnpack/README.md#sparse-inference

参考链接:
https://ai.googleblog.com/2021/03/accelerating-neural-networks-on-mobile.html

—  —

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

点这里????关注我,记得标星,么么哒~

加入AI社群,拓展你的AI行业人脉

量子位「AI社群」招募中!欢迎AI从业者、关注AI行业的小伙伴们扫码加入,与50000+名好友共同关注人工智能行业发展&技术进展

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

谷歌发布TF新工具:计算速度提升2倍,减少无效参数相关推荐

  1. AI一分钟 | 李开复:AI创业公司估值今年会降20%~30%;谷歌让搜索结果加载速度提升两倍...

    ▌李开复:AI 创业公司估值今年会降 20%~30% 创新工场创始人李开复的新书<AI·未来>昨天正式全球发售,在发布现场,李开复谈到目前国内 AI 创业企业现状时表示,今年国内 AI 创 ...

  2. 【云原生AI】Fluid + JindoFS 助力微博海量小文件模型训练速度提升 18 倍

    简介: 深度学习平台在微博社交业务扮演着重要的角色.计算存储分离架构下,微博深度学习平台在数据访问与调度方面存在性能低效的问题.本文将介绍微博内部设计实现的一套全新的基于 Fluid(内含 Jindo ...

  3. 英伟达发布ChatGPT专用GPU,性能提升10倍,还推出云服务,普通企业也能训练LLM...

    Pine 发自 凹非寺 量子位 | 公众号 QbitAI "AI的iPhone时刻已至",英伟达或成最大赢家. 在GTC2023大会上,黄仁勋接连放出大招: 不仅发布了ChatGP ...

  4. 如何将 iOS 工程打包速度提升十倍以上

    如何将 iOS 工程打包速度提升十倍以上 过慢的编译速度有非常明显的副作用.一方面,程序员在等待打包的过程中可能会分心,比如刷刷朋友圈,看条新闻等等.这种认知上下文的切换会带来很多隐形的时间浪费.另一 ...

  5. ZippyPoint: 一种基于学习的特征点提取+二进制描述子,速度提升5倍+,为移动平台提供一种ORB的替代方案...

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨Realcat 来源丨 计算机视觉SLAM 作者来自ETHZ Computer Vision实验 ...

  6. 阿里公开自研AI集群细节:64个GPU,百万分类训练速度提升4倍

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 编辑:Sophia 计算机视觉联盟  报道  | 公众号 CVLianMeng 转载于 :量子位 AI博士笔记系列推 ...

  7. 阿里 AI 研究成果入选国际顶会 ICML 2020,AI 推理速度提升 3 倍

    近日,人工智能国际顶会ICML 2020公布了论文收录结果,阿里巴巴7篇论文入选,是入选论文数量最多的中国科技公司.ICML是机器学习领域全球最具影响力的学术会议之一,今年接受率仅为21.8%. 根据 ...

  8. 华为开发者贡献 Linux 内核补丁,将核心内核函数速度提升 715 倍

    公众号关注 「奇妙的 Linux 世界」 设为「星标」,每天带你玩转 Linux ! Linux 6.2 近日合并了一个重要补丁,该补丁能够将一个核心内核函数速度提升 715 倍. 从合并的注释可知, ...

  9. 优化:一种将grid-search速度提升10倍的方法

    Python 2.7 IDE Pychrm 5.0.3 sci-kit learn 0.18.1 前言 抖了个机灵,不要来打我,这是没有理论依据证明的,只是模型测试出来的确有效,并且等待时间下降(约) ...

最新文章

  1. Activiti 开始流程时存储发起人员USERID
  2. 原文件内容更新及备份,特殊标量$^I和@ARGV学习笔记
  3. 闪存技术论坛即将召开 产业链领军企业齐聚谈变革
  4. python3 scrapy 教程_Scrapy 教程
  5. QT的QQmlIncubationController类的使用
  6. java excel 导出图片_JAVA 使用 POI 导出 EXCEL 自定义背景颜色
  7. 如何在Appscale下发布自己的应用(一)
  8. 设计模式(六)原型模式
  9. web-4. 装饰页面的图像
  10. 【TWVRP】基于matalb模拟退火算法求解带时间窗的车辆路径规划问题【含Matlab源码 160期】
  11. 分享97个上传下载PHP源码,总有一款适合你
  12. 地点坐标拾取,经纬度精确到小数点后6位
  13. 查看抽取解压缩和修改war包
  14. 【博文笔记】Attentive Reader\Impatient Reader:机器阅读理解之开山之作Teaching Machines to Read and Comprehend
  15. 逻辑思维题 微信18954274246 答案
  16. 新 iPhone 去“刘海”、AR/VR 头显或成 One More Thing,苹果秋季发布会前瞻!
  17. 「信号机制」Python信号处理—signal模块
  18. iOS10、11自定义左滑菜单项背景图片
  19. 小米推行高端化战略,但失去性价比优势或是它不可承受之重
  20. java中jcl_Java日志框架——JCL

热门文章

  1. 如何从字符串中删除文本?
  2. 如何在Eclipse中构建APK文件?
  3. 《敏捷软件开发》第二章极限编程实践
  4. 关于无服务器(Serverless)架构你要搞懂的8件事
  5. 【实战教程】腾讯云搭建微信小程序服务
  6. 开源阿牛图像处理实验室
  7. ubuntu10.0.4使用再生龙还原后在启动时不能正常启动
  8. 第二组视频:MySQL复制
  9. Aix /etc/hosts.equiv 文件的用途及用法
  10. LAMP麻辣网站的搭建