谷歌发布轻量级视觉架构MobileNetV2,速度快准确率高
林鳞 编译自 Google Research Blog
量子位 出品 | 公众号 QbitAI
深度学习在移动端部署的挑战仍在。
虽然深度学习在图像分类、检测等任务上颇具优势,但提升模型精度对能耗和存储空间的要求很高,移动设备通常难以达到要求。
别怕。昨天,谷歌发布了新一代移动架构MobileNetV2。
这是一种为移动设备设计的通用计算机视觉神经网络,支持图像分类和检测等任务,结果比上一代模型有显著提升。在个人移动设备上运行深度网络能时能提升体验,让用户能在任何时间和地点进行访问,在安全、隐私和能耗上还有额外优势。
新特性
基于去年发布的MobileNetV1的构建思路,新模型将深度可分离的卷积作为有效构建模块。在架构上,MobileNetV2引入了两个新特性:一是层与层之间的线性瓶颈(linear bottlenecks),二是瓶颈之间的快捷连接。基本结构如下图所示:
△ MobileNetV2架构概览 | 蓝色块表示复合卷积架构模块
性能增强
总体来说,MobileNetV2能以更快的速度达到与V1相同的精度。
尤其值得注意的是,新模型减少了一半运算,所需参数减少30%,在谷歌Pixel手机上速度比MobileNetV1快了30-40%,同时实现了更高的精度。
△ MobileNetV2提高了速度(降低了延迟)并增加了ImageNet的Top 1的精度
在对象检测和分割任务中,MobileNetV2是种非常有效的特征提取器。例如当与新引入的SSDLite配对时,达到与MobileNetV1相同准确度时速度快了35%。目前研究人员已经在Tensorflow对象检测API下开放了这个模型。
为了实现设备上的语义分割,研究人员将MobileNetV2作为一个特征提取器,简化了用移动语义分割模型DeepLabv3构建新的Mobile DeepLabv3的过程。
在语义分割基准上,PASCAL VOC 2012结果模型达到与使用MobileNetV1作为特征提取器相似的性能,但所需参数减少了5.3倍,所需运算减少了5.2倍。
总体来说,MobileNetV2提供了一个高效的移动导向模型,可作为许多视觉识别任务的基础。
资源下载
目前,MobileNetV2作为TensorFlow-Slim图像分类库的一部分发布,用户也可在Colaboratory中开始探索使用。
此外,MobileNetV2也可作为TF-Hub上的模块,能在GitHub中找到预先训练的检查点。
官方博客介绍:
https://research.googleblog.com/2018/04/mobilenetv2-next-generation-of-on.html
相关论文:
https://128.84.21.199/abs/1801.04381
代码地址:
https://github.com/tensorflow/models/tree/master/research/slim/nets/mobilenet
TensorFlow-Slim图像分类库:
https://github.com/tensorflow/models/blob/master/research/slim/README.md
Colaboratory地址:
https://colab.research.google.com/github/tensorflow/models/blob/master/research/slim/nets/mobilenet/mobilenet_example.ipynb
作者系网易新闻·网易号“各有态度”签约作者
— 完 —
活动报名
加入社群
量子位AI社群15群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot6入群;
此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。
进群请加小助手微信号qbitbot6,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技术和产品新动态
谷歌发布轻量级视觉架构MobileNetV2,速度快准确率高相关推荐
- 超越CLIP!谷歌发布首个大规模MoE架构的视觉语言模型
文 | 明敏(发自凹非寺) 源 | 量子位 多模态模型常见,但是基于稀疏化的还是头一个.谷歌带来最新成果LIMoE,首次将稀疏化方法用在了图像文本混合模型上.要知道,随着大模型参数呈指数级增加,训练成 ...
- 谷歌最新提出无需卷积、注意力 ,纯MLP构成的视觉架构
11年it研发经验,从一个会计转行为算法工程师,学过C#,c++,java,android,php,go,js,python,CNN神经网络,四千多篇博文,三千多篇原创,只为与你分享,共同成长,一起进 ...
- 综述:轻量级CNN架构设计
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨Ironboy 来源丨GiantPandaCV 编辑丨极市平台 导读 本文作者结合论文和项目比赛 ...
- 本周AI热点回顾:GAN生成的超级马里奥关卡,可以永不通关的那种;MLP回归,纯多层感知机视觉架构媲美CNN、ViT...
点击左上方蓝字关注我们 01 MLP回归,无需卷积.自注意力,纯多层感知机视觉架构媲美CNN.ViT 当前,卷积神经网络(CNN)和基于自注意力的网络(如近来大火的 ...
- 谷歌新作:视觉Transformer超越ResNet!!!从头开始训练!
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 When Vision Transformers Outperform ResNets without ...
- 基于Attention机制的轻量级网络架构以及代码实现
点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要10分钟 Follow小博主,每天更新前沿干货 导读 之前详细介绍了轻量级网络架构的开源项目,详情请看深度学习中的轻量级网络架构总结与代码实现 ...
- 谷歌全新轻量级新模型ALBERT刷新三大NLP基准
谷歌全新轻量级新模型ALBERT刷新三大NLP基准 ICLR 2020提交论文数量达到2594篇,比去年增加了近1000篇.其中,来自谷歌的一篇论文引起格外瞩目,该论文提出ALBERT模型,比BERT ...
- 谷歌发布TF新工具:计算速度提升2倍,减少无效参数
萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 一顿操作后,需要实时模糊背景的视频,看起来流畅了不少: 实时目标检测的延迟也更低了: 这是谷歌特意为移动设备和Web端开发的一系列新工具,可 ...
- 轻量ViT王者 | EfficientFormerV2:全新轻量级视觉Transformer
点击下方卡片,关注"自动驾驶之心"公众号 ADAS巨卷干货,即可获取 点击进入→自动驾驶之心[模型部署]技术交流群 后台回复[模型部署工程]获取基于TensorRT的分类.检测任务 ...
最新文章
- (ios实战):retain,copy,assign及autorelease ,strong,weak
- myeclipse同时部署两个项目-permgen space
- Java数据库连接(JDBC)之二:Statement对象和PreparedStatement对象的使用
- Persistent Memory错误注入测试
- 【Git入门之五】版本管理
- JDK源码解析之 Java.lang.StringBuffer
- 超全Linux备份工具集合,满足你的所有需要!
- 顺丰控股:1月速运物流业务营收172.8亿元 同比增长14.23%
- 封装性的基本使用练习2
- Node-介绍与模块化
- 海思MPP venc 分析
- BooKu手机电子书阅读器,正式推出了
- 在Android上使用AutoNavi Map API开发自己的地图应用程序
- freemarker制作word模板
- win10不兼容 软件 ietest
- 小米 gps信号测试软件,实时查看,防走丢神器:小米 米兔GPS定位器 防盗跟踪器 使用评测...
- 2022谷粒商城学习笔记(二十三)分布式事务
- 女生戴蓝牙耳机什么颜色好看?适合女生的高颜值蓝牙耳机
- Parsec测试基准程序在zynq板上测试
- 40篇最受网友欢迎的web前端HTML精选文章合集
热门文章
- 如何评价程序员相亲约在肯德基反被拉黑?
- 和阿里同年创办,为何当当却走向了“卖身”的结局?
- 重大改革:Python 语言将被加入高考科目,VB 惨被淘汰!
- 成立一年 百度搜索公司迎来首任 CTO
- 远程登录服务器哪个工具好,远程登录服务器,有什么比较好用的工具?
- 无法完成您的itunes store的请求_iTunes 谢幕,盘点它的这 18 年
- pytorch调用不了多个gpu_pytorch利用多个GPU并行计算
- 布谷鸟哈希函数的参数_系统学习hash算法(哈希算法)
- 云服务器磁盘挂载_云服务器快照是备份的吗?
- java 字节流写入_Java之基于字节流文件的写入和读取