1 背景

近年来深度学习模型在计算机视觉、自然语言处理、搜索推荐广告等各种领域,不断刷新传统模型性能,并得到了广泛应用。随着移动端设备计算能力的不断提升,移动端AI落地也成为了可能。相比于服务端,移动端模型的优势有:

  1. 减轻服务端计算压力,并利用云端一体化实现负载均衡。特别是在双11等大促场景,服务端需要部署很多高性能机器,才能应对用户流量洪峰。平时用户访问又没那么集中,存在巨大的流量不均衡问题。直接将模型部署到移动端,并在置信度较高情况下直接返回结果,而不需要请求服务端,可以大大节省服务端计算资源。同时在大促期间降低置信度阈值,平时又调高,可以充分实现云端一体负载均衡。
  2. 实时性好,响应速度快。在feed流推荐和物体实时检测等场景,需要根据用户数据的变化,进行实时计算推理。如果是采用服务端方案,则响应速度得不到保障,且易造成请求过于密集的问题。利用端计算能力,则可以实现实时计算。
  3. 稳定性高,可靠性好。在断网或者弱网情况下,请求服务端会出现失败。而采用端计算,则不会出现这种情况。在无人车和自动驾驶等可靠性要求很高的场景下,这一点尤为关键,可以保证在隧道、山区等场景下仍能稳定运行。
  4. 安全性高,用户隐私保护好。由于直接在端上做推理,不需要将用户数据传输到服务端,免去

机器学习9 -- 模型压缩和加速相关推荐

  1. 深度学习实战——模型推理优化(模型压缩与加速)

    忆如完整项目/代码详见github:https://github.com/yiru1225(转载标明出处 勿白嫖 star for projects thanks) 目录 系列文章目录 一.实验思路综 ...

  2. 模型压缩和加速方法总结和文献综述

    本文集中了一些针对模型压缩和技巧,用于加快计算速度的论文. 如下所示,模型压缩具有不同的技术,在这里我将主要列出深度学习网络部分. 1. Review papers,综述文章 以下是推荐用于模型压缩和 ...

  3. 深度学习模型压缩与加速综述!

    ↑↑↑关注后"星标"Datawhale 每日干货 & 每月组队学习,不错过 Datawhale干货 作者:Pikachu5808,编辑:极市平台 来源丨https://zh ...

  4. 深度学习模型压缩与加速综述

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 导读 本文详细介绍了4种主流的压缩与加速技术:结构优化.剪枝.量化 ...

  5. 一文看懂深度学习模型压缩和加速

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文转自:opencv学堂 1 前言 近年来深度学习模型在计算机视 ...

  6. 腾讯 AI Lab 正式开源PocketFlow自动化深度学习模型压缩与加速框架

    11月1日,腾讯AI Lab在南京举办的腾讯全球合作伙伴论坛上宣布正式开源"PocketFlow"项目, 该项目是一个自动化深度学习模型压缩与加速框架,整合多种模型压缩与加速算法并 ...

  7. 端上智能——深度学习模型压缩与加速

    摘要:随着深度学习网络规模的增大,计算复杂度随之增高,严重限制了其在手机等智能设备上的应用.如何使用深度学习来对模型进行压缩和加速,并且保持几乎一样的精度?本文将为大家详细介绍两种模型压缩算法,并展示 ...

  8. 模型压缩与加速:Octave Convolution

      自AlexNet刷新了ImageNet比赛的最佳记录以来,神经网络的又一次高潮猛烈的到来了.一些列各种各样的网络层出不穷,图像/音频/文本等各种任务下都开始了神经网络一统天下的声音.然而神经网络虽 ...

  9. 优秀!腾讯AI Lab开源模型压缩与加速框架PocketFlow!

    点击我爱计算机视觉标星,更快获取CVML新技术 PocketFlow,成熟高效的模型压缩与加速框架,经过腾讯内部AI技术商用实践检验,你值得拥有- 以下内容来自腾讯AI实验室(tencent_aila ...

最新文章

  1. 解决:Error: Insufficient values in manual scale. 5 needed but only 4 provided.Run `rlang::last_error()
  2. matlab 2009a使用教程,实验一 安装MATLAB R2009a软件及其简单操作
  3. ESXI中VM迁移或OVF模板导入linux系统常规操作
  4. 水系影像分析_“天眼”助力 甘肃运用卫星影像精准研判灾情
  5. 数据库连接oracle 10g rman 备份与恢复 之一
  6. datasnap 2011连接池,数据集对象池
  7. 鸿蒙后的时期有什么,鸿蒙系统什么时候上市 华为鸿蒙系统有多厉害?
  8. .NET Conf 2017后初尝Xamarin Forms 3.0@Linux
  9. intp适合学计算机吗,⑨MBTI测试,分析INTP型人格的专业选择和职业选择
  10. ElasticSearch聚合查询
  11. 年度影像旗舰vivo X70系列正式发布 售价3699元起
  12. Excel-VBA操作文件四大方法之一(1/4)
  13. 图信号处理之图拉普拉斯矩阵的含义
  14. qt 获取屏幕分辨率
  15. 实时文件同步软件--端端(Clouduolc)的诞生小记
  16. 计算机竖版桌面,电脑桌面竖屏了怎么办
  17. 益世科生物冲刺港交所上市:业绩持续增长,IPO前紧急“套现”
  18. 【javaWeb微服务架构项目——乐优商城day15】——会调用订单系统接口,实现订单结算功能,实现微信支付功能
  19. GD32 ADC采集电压
  20. leetcode:前 K 个高频元素、删除字符串中的所有相邻重复项、有多少小于当前数字的数字、有效的山脉数组、独一无二的出现次数(JavaScript)

热门文章

  1. 无意苦争春,一任群芳妒!M1 Mac book(Apple Silicon)能否支撑全栈工程师的日常?(Python3/虚拟机/Docker/Redis)
  2. Windows 更新:服务堆栈更新
  3. 干货收集和整理:Pytorch,Keras,数据分析
  4. 0x01.被动信息收集
  5. [多图]未来iPhone的虚拟SIM卡结构
  6. 多语言多用户商城系统 中英文电商系统困境及解决思路
  7. Windows非法文件和目录的创建及删除方式
  8. java 管道设计_设计模式——管道模式
  9. AppServ 特来电共享充电桩PHPstudy系统开发
  10. 如何用java制作二维码