在开发以卷积神经网络(CNN)为核心的机器学习模型时,我们通常会先使用固定的资源成本,构建最初的模型,然后增加更多资源(层数)扩展模型,从而获得更高的准确率。

著名的 CNN 模型 ResNet(深度残差网络),就可以用增加层数的方法从ResNet-18 扩展到 ResNet-200。谷歌的 GPipe 模型也通过将基线 CNN 扩展 4 倍,在 ImageNet 数据库上达到 84.3% 的准确率,力压所有模型。

一般来说,模型的扩大和缩小都是任意增加 CNN 的深度或宽度,抑或是使用分辨率更大的图像进行训练和评估。虽然这些传统方法提高准确率的效果不错,但大多需要繁琐的手动调整,还可能无法达到最佳性能。

因此,谷歌AI团队最近提出了新的模型缩放方法“复合缩放(Compound Scaling)”和配套的 EfficientNet 模型。他们使用复合系数和 AutoML 从多个维度均衡缩放 CNN,综合考虑深度和宽度等参数,而不是只单纯地考虑一个,使得模型的准确率和效率大幅提升,图像识别的效率甚至可以大幅提升 10 倍。

这项新方法的根本优势在于实践起来非常简单,背后的原理很好理解,甚至让人怀疑为什么没有被更早发现。该研究成果以论文的形式被 ICML 2019(国际机器学习大会)接收,名为 EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks。EfficientNet 模型的相关代码和 TPU 训练数据也已经在 GitHub 上开源。

寻找复合系数

为了弄清楚神经网络缩放之后的效果,谷歌团队系统地研究了改变不同维度对模型的影响,维度参数包括网络深度、宽度和图像分辨率。

首先他们进行了栅格搜索(Grid Search)。这是一种穷举搜索方法,可以在固定资源的限定下,列出所有参数之间的关系,显示出改变某一种维度时,基线网络模型会受到什么样的影响。换句话说,如果只改变了宽度、深度或分辨率,模型的表现会发生什么变化。

图 | 以基线网络为基础,列出所有维度变化对模型的影响(来源:谷歌 AI)

综合考虑所有情况之后,他们确定了每个维度最合适的调整系数,然后将它们一同应用到基线网络中,对每个维度都进行适当的缩放,并且确保其符合目标模型的大小和计算预算。

简单来说,就是分别找到宽度、深度和分辨率的最佳系数,然后将它们组合起来一起放入原本的网络模型中,对每一个维度都有所调整。从整体的角度缩放模型。

与传统方法相比,这种复合缩放法可以持续提高模型的准确性和效率。在现有模型 MobileNet 和 ResNet 上的测试结果显示,它分别提高了 1.4% 和 0.7% 的准确率。

高效的网络架构和性能

缩放模型的有效性也依赖于基线网络(架构)本身。

因为,为了进一步提高性能,谷歌 AI 团队还使用了 AutoML MNAS 框架进行神经架构搜索,优化准确性和效率。AutoML 是一种可以自动设计神经网络的技术,由谷歌团队在 2017 年提出,而且经过了多次优化更新。使用这种技术可以更简便地创造神经网络。

由此产生的架构使用了移动倒置瓶颈卷积(MBConv),类似于 MobileNetV2 和 MnasNet 模型,但由于计算力(FLOPS)预算增加,MBConv 模型体积略大。随后他们多次缩放了基线网络,组成了一系列模型,统称为 EfficientNets。

图 | EfficientNet-B0 基线网络架构(来源:谷歌 AI)

为了测试其性能,研究人员与 ImageNet 上的其他现有 CNN 进行了比较。结果显示,EfficientNet 在大多数情况下表现亮眼,比现有 CNN 的准确率和效率都高,还将参数大小和计算力降低了一个数量级。

比如 EfficientNet-B7 在 ImageNet 上达到的 Top-1 最高准确率是 84.4%,Top-5 准确率是 97.1%。在 CPU 推理上,它的体积比最好的 CNN 模型 GPipe 小 8.4 倍,但速度快了 6.1 倍。与广泛使用的 ResNet-50 相比,EfficientNet-B4 使用了类似的计算力,但 Top-1 准确率从 76.3% 提升到了 82.6%。

图 | 参数使用量和 ImageNet Top-1 准确率对比(来源:谷歌 AI)

此外,EfficientNets 不仅在 ImageNet 上表现出众,其能力还可以转移到其它数据集上。

他们在 8 个流行的迁移学习数据集上测试了 EfficientNets。结果显示,它在其中的 5 个上面都拿到了顶尖成绩,例如在 CIFAR-100 上获得了 91.7% 的成绩,在 Flowers 上获得了 98.8% 的成绩,而且参数至少减少了一个数量级,甚至还可以最多减少 21 倍,说明 EfficientNets 具有很强的迁移能力。

谷歌 AI 团队认为,EfficientNets 有望凭借简单易操作的特点,成为未来计算机视觉任务的新基石。

参考:https://ai.googleblog.com/2019/05/efficientnet-improving-accuracy-and.html​ai.googleblog.comhttps://arxiv.org/pdf/1905.11946.pdf​arxiv.org

ai google 风格化图像_谷歌 AI 新方法:可提升 10 倍图像识别效率,关键还简单易用...相关推荐

  1. 特斯拉好事连连:自动驾驶新硬件性能提升10倍,两名新董事昨晚上任,股价涨5.6%...

    晓查 发自 凹非寺  量子位 出品 | 公众号 QbitAI 特斯拉下半年被马斯克"坑惨了",8月口头宣布私有化,9月在博客上抽大麻,这些荒诞不经的行为让特斯拉股价一路下跌. 现在 ...

  2. AI如何提升10倍筛药效率?6月18日华为云携手中科院上海药物所揭开谜底

    摘要:6月18日,华为云TechWave全球技术峰会(人工智能&数据)围绕人工智能.大数据.数据库.华为云Stack等热点话题,携手来自全球的IT精英.技术大咖.先锋企业.合作伙伴共话前沿技术 ...

  3. 一体机性能服务器图片介绍,浪潮发布AI一体机 整体性能较普通服务器提升10倍以上...

    原标题:浪潮发布AI一体机 整体性能较普通服务器提升10倍以上 9月10日,浪潮携手第四范式在京联合发布了AI软硬件一体机产品"Prophet AIO",寓意为打造"AI ...

  4. 单线程和多线程的区别_谷歌下载东西超慢?开启Chrome多线程下载,下载速度提升10倍+...

    用谷歌浏览器下载速度慢,浏览器采用的是单线程下载,"一人难敌四手"的浏览器自然斗不过多线程了.所以说浏览器想要提高下载速度,就得采用多线程的下载方式,不过到目前为止,Chrome多 ...

  5. 谷歌ai人工智能叫什么_谷歌正在通过AI策展和内置订阅全面革新Google新闻

    谷歌ai人工智能叫什么 Google is overhauling Google News with an AI-driven home screen and a quick way to subsc ...

  6. ai无法启动产品_启动AI启动的三个关键教训

    ai无法启动产品 重点 (Top highlight) Let me be upfront: I was the technical co-founder of an AI startup and i ...

  7. ai项目实施步骤_停止AI产品开发中道德责任的6个步骤

    ai项目实施步骤 这是官方的:人工智能(AI)并不是我们想要成为的公正的天才. Google的母公司Alphabet(Alphabet)使用其最新的年度报告来警告称,对其产品的道德顾虑可能会损害未来的 ...

  8. google地图网页版_谷歌收录查询方法大全,如何让Google快速收录网页?

    谷歌收录是指,Google有没有将你的网页,放入自己的数据库.这样可以在谷歌seo的时候,达到可以通过自然流量搜索到你,并且产生询盘.订单等目的.在过去的几年,也就是Google缺数据的时候,你的谷歌 ...

  9. ai自动生成字幕_使用AI对您的会议进行现场字幕

    ai自动生成字幕 Many people rely on captions every day. Unfortunately, not everything has captions; this of ...

  10. ai人工智能市场客户_投资管理中的人工智能可提升客户关系和回报

    ai人工智能市场客户 Let's be honest. An investment manager's clients probably won't care about the fancy AI t ...

最新文章

  1. OpenCV作图像处理和识别方面的编程时常用的基础语句积累
  2. ASP.NET中 DropDownList+DetailsView(详细视图)的使用前台绑定
  3. Matlab画图小结(一)
  4. 《Head First Servlets JSP(中文版)》书摘
  5. html连在一起的选择器,请问关于css选择器的问题:两个类选择器连在一起是什么意思?...
  6. 【JVM】JVM指令集总结
  7. redis命令 举例
  8. [Wix] 搞了这么久才知道Wix怎么装
  9. Flex与.NET互操作系列文章索引
  10. 下次激活策略10_(好文重读)低风险之可转债4大卖出策略
  11. 洛谷P3690 LCT模板
  12. 004 Leaflet 第四个demo 使用自己的图标替换marker图标
  13. mac mysql 移动硬盘_mac挂载移动硬盘可以读写的方法
  14. 资产管理可视化系统-RFID固定资产管理追踪方案-RFID资产管理解决方案-新导智能
  15. ArcGIS介绍:ArcObjects、 ArcGIS Desktop、ArcGIS Engine 和 ArcSDE、ArcIMS、ArcGIS Server
  16. [LeetCode 中等 树]545. 二叉树的边界
  17. 2023年河北医科大学临床检验诊断学考研分享
  18. tp剩余未验证内容-6
  19. Jetson TX2上配置archiconda、Yolov5、tensorrtx环境问题记录
  20. Java 开发必备:神器

热门文章

  1. Ubuntu改坏sudoers后无法使用sudo的解决办法
  2. Git bash使用中...
  3. Java文件编码自动转换工具类(只改变编码,不会改变文件内容)
  4. Win7下如何破解Visual Studio2008 90天试用版
  5. 如何解决缓存与数据库不一致?
  6. Eclipse调试远程服务器
  7. bzoj1458 士兵占领
  8. php 计算两个时间相差的天数、小时数、分钟数、秒数详解及实例代码
  9. Node.app让Nodejs平台在iOS和OS X系统上奔跑
  10. php中用户自定义排序