苹果M1芯片机器学习向测评:Mini 比RTX 2080Ti 快14%,Air好于Pro
本文转载自AI科技评论。
作者 | 蒋宝尚
编辑 | 青暮
今年双十一,苹果发布了新Mac系列,拿出了首款自研ARM架构的芯片。这款5nm制程的SoC(系统级芯片)号称大幅度提升了性能。
例如,新款MacBook Air相比于上一代,CPU性能提升3.5倍,GPU性能提升 5 倍,机器学习能力提升9倍,固态硬盘的性能也提升了 2 倍。
新款MacBook Pro,CPU性能比上一代提升了 2.8 倍,GPU提升5 倍,机器学习能力提升 11 倍。
新款Mac Mini,能效提高了60%,CPU速度提高了3倍,图形显示速度提高了6倍。
真实体验如何,众多UP主也在第一时间进行了测评,测评的内容包括:打游戏的速度、听音乐的音质、剪辑视频的效果......
但机器学习方面的测评相对稀少。真就如苹果发布会说的那样,机器学习速度能够提高数倍?在medium上,名为Daniel Bourke博主,发布了一篇博客,从机器学习训练测评的角度论证了苹果M1芯片的强大。
Bourke一共进行了两大块的实验:CreateML和TensorFlow macOS 代码。两个实验的结果都说明了新版M1芯片的电脑比“老”版本Intel芯片电脑运行速度要快。在其他博主的文章中,也有博文论证了:M1芯片在机器学习训练的时候,比RTX 2080Ti GPU快14%!
1
实验一:CreateML:Air好于Pro
在进行CreateML训练之前,作者说,他从未运行过CreateML。这次测评,也就是要看看这款专门为适配苹果而打造的机器学习平台到底有多强大。
图注:训练操作界面
这次测试中,每台的Mac的设置如下:
问题:多类图像分类
模型:CreateML图像分类(不知道苹果使用的是什么网络架构,猜是ResNet)
数据大小:7500张训练图片,2500张测试图片
最大迭代次数:25
数据增强的方法:翻转,旋转
测评结果如上所示,没有风扇的MacBook Air表现最佳,7核GPU M1完爆MacBook Pro的8核M1 GPU。而16英寸的Macbook pro,在训练没结束之前就已经阵亡了。
很明显,苹果的CreateML平台已经针对M1芯片进行了潜在的优化。因为,尽管拥有8核专用GPU,Intel驱动的MacBook Pro却没能完成实验。
2
实验二:TensorFlow macOS
在11月份M1芯片发布会上,苹果声称新款自研芯片比前几代产品有更快的运行的速度,并特别提到了“类似TensorFlow这样的深度学习框架”。
然后作者从TensorFlow团队和Apple Machine Learning团队发布的博客文章中,找到机器学习模型在搭载M1芯片和Intel芯片的Mac电脑上的训练结果。
事实证明,苹果最近根据TensorFlowTensor发布了Flow_MacOS,这意味着其允许开发者能够在Mac上运行“原生”TensorFlow代码”。
于是,作者奇迹般的将Apple的TensorFlow fork安装到了Python 3.8环境中,在没有进行8-10个小时的故障排除情况下,创建以下三个小实验。
第一个实验是:基础的卷积神经网络(CNN),具体模型设置代码如下图:
具体而言,作者复制了CNN解析网站上的CNN架构(TinyVGG),并使用了类似于CreateML测试的数据集。
问题:多类图像分类
模型:TinyVGG
数据:7500张训练图片,2500张测试图片
类的数量:10个
epochs的数量:5
Batch size: 32
注:CNN Explainer网址
https://poloclub.github.io/cnn-explainer/
第二个实验是使用EfficientNetB0进行迁移学习。因为当前,从头开始做模型非常麻烦。
作者使用现有的未经训练的架构,并根据具体的数据对其进行训练。或者使用像EfficientNet这样的预先训练的架构,并根据具体的数据对其进行微调。
问题:多类图像分类
模型:Headless EfficientNetBO
数据:750个训练图像,625个测试图像(2500×0.25的validation_steps参数)
类的数量:10个(来自Food101数据集)
epochs数:5
Batch size:4(由于M1没有足够的内存容量来处理较大的Batch size,所以需要较低的批Batch size,作者尝试了32、16、8,但它们都失败了)
第三个实验,是作者在浏览Apple的tensorflow_macos GitHub时,发现的一个问题线程(issue thread)。包含了在不同机器上运行的benchmark,所以作者决定把它加入到测试中。
问题:多类图像分类
模型:LeNet
数据:60,000张训练图片,10,000张测试图片(MNIST)
类的数量:10个
epochs的数量:5
Batch size: 32
3
TensorFlow代码测评结果
除了在MAC 上运行上述三个实验之外,作者还在GPU驱动的Google Colab上运行了(作者的策略是:在Google Colab上进行实验,需要时扩展到更大的云服务器上去)。
如上图所示,谷歌Colab表现最棒,但搭载M1芯片的MacBook也并没有落后太多。MacBook意味着能够在本地运行实验,无需一直连接到Colab,这会带来极大的方便。
注意,上述对比,由于数据加载,第一个epoch通常时间最长的,因此对比的是第二个epoch之后的训练时间。另外,Google Colab GPU实例使用的是纯TensorFlow而不是tensorflow_macos。
值得注意的是,在基本的CNN和迁移学习实验中,搭载M1电脑的表现明显优于搭载Intel的电脑。而tensorflow_macos基准测试中,Intel也收复了一些失地。作者认为这是明确在训练中使用GPU的结果。
M1 Mac Mini机器学习测评
以上是对Air和pro两个版本的测评,那么新版的M1 Mac Mini效果如何呢?在另一篇medium博文上,Andrew A Borkowski测评发现,M1 Mac Mini的训练速度比RTX 2080Ti还要快。
具体而言,是作者根据苹果GitHub网站的说明在Mac Mini上安装了tensorflow_macos,并完成了fashi-MNIST数据集中的分类任务。测试结果是:训练和测试耗时6.70秒,比RTX 2080Ti GPU快14%!
注:RTX 2080Ti 的试验配置是System: Linux;CPU:Intel® Core™ i7–9700K;RAM: 32GB;Storage: 1TB SSD。而苹果电脑的配置是:System: macOS Big Sur;Storage: 512GB SSD;Unified Memory: 8GB ;M1芯片包含8个CPU核,8个GPU核以及16个神经网络引擎核心。
但,在数据集较大的模型上,M1 Mac Mini用了2286.16秒。比使用Nvidia RTX 2080Ti GPU的Linux机器要长5倍多!根据Mac的活动监控器,CPU的使用量极少,完全没有使用到GPU。
总结一下:由于M1 TensorFlow目前还是Alpha版本,未来有希望利用芯片的GPU和神经引擎内核来加速机器学习训练。
参考资料:
https://towardsdatascience.com/apples-new-m1-chip-is-a-machine-learning-beast-70ca8bfa6203
END
备注:CV
计算机视觉交流群
图像分割、姿态估计、智能驾驶、超分辨率、自监督、无监督、2D、3D目标检测等最新资讯,若已为CV君其他账号好友请直接私信。
我爱计算机视觉
微信号:aicvml
QQ群:805388940
微博知乎:@我爱计算机视觉
投稿:amos@52cv.net
网站:www.52cv.net
在看,让更多人看到
苹果M1芯片机器学习向测评:Mini 比RTX 2080Ti 快14%,Air好于Pro相关推荐
- 苹果M1芯片机器学习测评出炉!Mini比RTX 2080Ti快14%,Air好于Pro
点击上方"CVer",选择加"星标"置顶 重磅干货,第一时间送达 来源:AI科技评论 作者 | 蒋宝尚 编辑 | 青暮 今年双十一,苹果发布了新Mac系列,拿出 ...
- 苹果M1芯片MacBook/iMac/Mac mini降级或者重装系统教程
苹果M1芯片MacBook/iMac/Mac mini降级或者重装系统教程. 很高兴又和大家见面了,苹果的M1芯片自横空出世后,其强悍的运算能力和低功耗满足大部分爱剪辑的工作者,然而M1芯片以其集成内 ...
- 苹果M1芯片怎么样---苹果M1参数与测评
前言:2020年11月11日,苹果正式发布第一款用于Mac的自研电脑芯片M1.这颗芯片采用台积电5纳米制程工艺,CPU.GPU.缓存集成在一起,拥有8核CPU(其中4颗为高性能核心,另外四颗为高能效核 ...
- 苹果M1芯片及新产品布局对ARM生态影响
在PC领域,苹果在2005年之前采用IBM PowerPC芯片,从2005-2020年采用Intel x86芯片,最近则新发布了苹果M1芯片.M1是一款基于ARM架构的苹果自研芯片.本文简单介绍苹果M ...
- 苹果M1芯片其实没有那么好?英特尔做了套PPT官方反击
点击上方"CVer",选择加"星标"置顶 重磅干货,第一时间送达 本文转载自:机器之心 | 编辑:泽南.蛋酱 苹果 M1 芯片的笔记本真的那么神奇吗?英特尔 ...
- 研究机构:苹果M1芯片代工订单占台积电5nm工艺25%产能
据国外媒体报道,基于Arm架构,采用台积电5nm工艺制造的苹果首款自研Mac芯片M1,已在11月11日凌晨的发布会上推出,也一并推出了搭载M1芯片的MacBook Air.13 英寸MacBook P ...
- 苹果M1芯片:如何开启一个时代
来源 | 老石谈芯 头图 | CSDN下载自视觉中国 11月11日,苹果今年的发布会三部曲终于落下了帷幕.这场压轴大戏上,发布了苹果自研芯片Apple Silicon的第一代产品:M1芯片.首批搭载M ...
- 新MAC苹果M1芯片简要分析(是不是地表最强呢??)
苹果M1芯片 出众的性能,极其优秀的能耗比 强大的软硬件生态助力 总结与展望 在刚刚举行的苹果秋季活动中,苹果对旗下的Mac产品线进行了更新,发布了全新. Pro 13以及Mac mini,三款产品的 ...
- 苹果m1芯片相当于什么水平
根据最新的GFXBench 5.0跑分数据库,苹果M1芯片的图形性能超越了NV GeForce GTX 1050 Ti和AMD Radeon RX 560等桌面级独立显卡. MacBook Pro更多 ...
最新文章
- Java线程优先级的概念
- Performance comparison Raw device VS Ext2 VS Ext3 VS OCFS
- Javascript/Jquery——简单定时器
- Android的Window类详解
- python学习类型转换_Python学习总结5:数据类型及转换
- TensorFlow基础篇(一)——tf.train.exponential_decay()
- 前端路由和后端路由(浅聊)
- 诛仙3饮马江南服务器信息,横刀云渺,饮马天河----浅谈云渺天河5S单刷
- worldwind java 教程_科学网—用worldwind java SDK开发应用程序 - 谢安涛的博文
- 《神经科学:探索脑》学习笔记(合集)
- 微信二维码生成步骤(本人亲测)
- 提神醒脑 MVP、MVVM 关系精讲
- 解决from Crypto.Cipher import AES报错
- ABAP SPLITTER技术总结及使用技巧
- spotify mp3_创建无监督学习的Spotify播放列表
- 蚂蚁金服-微贷事业群 (北京、杭州)招前端
- 文档矫正(计算机视觉实验)
- b站coderwhy老师_Vue项目开发-仿蘑菇街电商APP
- Python pivot详解
- c语言汉诺塔问题用指针变量,谁会用C语言解决汉诺塔问题?请进,最好把每一步的解释写上有三个 爱问知识人...
热门文章
- python qq邮箱的SMTP服务器需要身份验证
- mbti人格类型测试助手微信小程序源码
- css font-family常用的黑体宋体等字体中英文对照表
- ASUSIROG 枪神7 Plus 超竞版G834JZ JY G634JZ JY原厂系统
- C# FileSystemWatcher 多文件夹、多文件类型文件监控增加、修改、重命名和删除实例
- C#中Console.WriteLine()函数输出格式详解
- mc服务器怎么做交易系统,《我的世界》村民交易系统详解
- word中论文三段页码设置
- 2021年中国食用菌行业生产情况及出口贸易分析:行业产值产量不断增长,生产品种以香菇、黑木耳、平菇为主[图]
- .NET framework 一个关于OleDbParameters的Bug