目录

-       性能瓶颈不只是PCIe接口

-       测试平台:PCIe Gen4的另类尝试

-       评估SLC Cache容量&稳态写性能的2种方法

-       随机写起步30-25万IOPS、与企业级SSD差别

-       90℃温度保护、散热设计

-       PCIe 4.0平台展望:从11代Core到服务器/工作站

我很少下功夫去做消费级/一般商用SSD的测试,除了3年前的Optane SSD 900P评测(2):比拼4x闪存NVMe RAID0》,不过Intel傲腾900P/905P是基于3D XPoint Memory而不是NAND闪存,性能基本等同于企业级的P4800X。

这次是因为终于拿到了PCIe 4.0(Intel架构)平台,我就找CCF的刘委员(平台小秘书)借来了WD SN850,M.2 NVMe接口的x4 lane理论带宽接近8GB/s,虽然SSD还跑不到那么快,但标称100万读IOPS还是有点吸引力的。

测试平台1(PCIe 4.0

某11代Core主机

CPU

Intel Core i3-1115G4(双核)

测试平台2(PCIe 3.0

Dell Precision 5820X Tower工作站(X299芯片组)

CPU

Intel Core i9-9980XE(18核)

操作系统

Windows 10 20H2

测试软件

CrystalDiskMark

HD Tune Pro

Iometer

性能瓶颈不只是PCIe接口

如下图,我先拿CrystalDiskMark简单跑了一轮。

注:点击图片后可缩放,以下同

左右两边测的都是这款WD SN850 1TB,却用了不同的主机平台。有朋友应该能看出右边是在PCIe 3.0上,超过3500MB/s也算达标了吧;左边的顺序读写带宽才是这款PCIe 4.0 SSD的真实水平。西部数据官方规格写的是读7,000MB/s、写5,300 MB/s。

上图中其实还有一个信息:左边的4KB随机读Q32T16性能比右边低不少,这是因为使用的双核的Core i3-1115G4 CPU跑满了。目前上市的Intel 11代CPU都还是针对中低功耗笔记本的,45W H系列、台式机,以及支持PCIe4.0的Xeon服务器还要等几个月。

结合这张IOPS视图看的更直观,47万读/40万写IOPS时Core i3-1115G4占用率达到100%。WD SN850官方标称4KB随机读/写IOPS为100万和72万,右边测试中看到的83万也是遇到了PCIe 3.0的瓶颈;至于64万写IOPS,这个只是在有限的LBA范围内(64GiB测试文件),如果按照企业级/数据中心SSD的标准,整盘能跑到多少我会在下文中测给大家看。

WD SSD配套的Dashboard软件中,可以看到当前的接口速率等信息。其中4K对齐判断是有帮助的,我就曾在这里看到“未对齐”而重新分过区。

消费级SSD的图形管理界面,其实这些功能也有别的方式可以实现。简单方便就好,后面我还会用到它的温度监测。

PCIe Gen4测试平台的另类尝试

 

当我在Dell 5820工作站上测试时,WD SN850是装在机箱前置的NVMe SSD热插拔位。具体的M.2转接套件结构我之前介绍过。

WD SN850使用了SanDisk自家主控、2颗512GB堆叠TLC闪存(应该是8通道,大约7-10%的OP冗余空间),还可以看到1颗Nanya DRAM缓存——1TB SSD上对应的是1GB。

这台Dell Precision 5820工作站本身配置了1个256GB NVMe前置SSD,测试中我就把这个位置换成WD SN850。铝质套件和导热贴对散热有一定帮助。

其实我还费了一番周折,尝试在这台工作站上搭建出对PCIe4.0的支持。具体来说是借来了《PCIe Switch Adapter:不只是NVMe HBA》中介绍过的Broadcom P411W-32P转接卡,把PCIe 4.0 Switch插在主板上的x16 PCIe 3.0插槽,希望借此支持1-2个Gen4 NVMe SSD。

看上去有点资源浪费吧?结果还没完全成功——当我将一块U.2接口的Optane 900P插在P411W-32P连接的背板上,已经可以识别到;但再经过接口转换之后却无法识别M.2的WD SN850。这个测试方案只好先作罢…

虽然没成功,还是要感谢下热情借给我PCIe/ SAS 4.0线缆的老同事、老朋友。友情推荐下他的淘宝店铺 http://shop35723783.taobao.com(极致一号店),Amphenol多年合作伙伴,特别是服务器/存储里用到的线缆,不同线序都是可以提要求定制的:)

测试SLC Cache容量 & 稳态写性能的2种方法

注:如无特别说明,以下测试都是在PCIe 3.0平台上进行。

从TLC闪存开始,多数消费级SSD就设计了模拟SLC Cache来加速写入的机制。不同SSD的SLC Cache区域容量不等,在实际应用/测试中看到的表现也就各异。

对于这方面的评估方法,我以前并没有仔细研究。本次用2款测试软件对比参照,相信能给大家一个满意的结果。

注:我跑的不是“文件基准”测试(点击放大查看)

受到PCIe 3.0接口限制,再加上HD Tune测试软件的“基准-写入”不能完全发挥高速NVMe SSD的带宽,WD SN850一开始跑到2600MB/s多,当写入量接近300GB时速度降到1100MB/s多。同时我也在观察Windows任务管理器显示的实时盘速,并且计时——第一阶段1分48秒也是相符的。

咱们就算280GB的SLC Cache吧,这需要用840GB左右的TLC闪存来模拟。降速之后这个阶段,我理解一方面要把SLC Cache中的数据转存(downgrade)到TLC区域,释放出更多的TLC闪存空间,同时还要接收新写入的数据。

HD Tune这个只能连续写入1000GB,为了进一步验证我又用Iometer做了30分钟的顺序写测试。

Iometer在PCIe 3.0接口上也能跑到3000MB/s以上,我们同样看到SLC Cache写满之后的降速,而当模拟Cache区完全清空之后,WD SN850的顺序写带宽又能回升到2000MB/s以上——这时才是TLC的原始性能。

如果我在测试前先把SSD写满数据,那么一开始就是2000MB/s出头这样。

企业级SSD不会有模拟SLC Cache的设计,因此顺序写一开始就应该是稳态(随机写有些不同,下文中有测试数据示例)。商用客户端平台如果不想要SLC Cache,也有符合要求的SSD,比如Dell标准的Class 50等级,参见在《万兆NAS模拟测试:是什么限制了性能?》中做过的介绍。

横坐标为总队列深度:线程x QD;延时单位是微秒

我习惯性用Iometer也跑了WD SN850的随机读IOPS折线图,手头正好有几年前Intel企业级P3700 SSD的结果就顺便对照下。

SN850在队列深度256时才达到819,303读IOPS(仍受限于PCIe 3.0测试平台,没看到100万IOPS稍显遗憾),我以前写过一篇基于NAND闪存SSD性能的“色子效应”,低队列深度要想更好只有Optane。

延时方面WD SN850可低至100µs以内,这一块我并没有反复测试以求尽量精确的对比,大家参考一下即可,毕竟Intel P3700是多年前的SSD了。

企业级和消费级/一般商用SSD的性能差别,主要是在稳态写方面,当然还有写寿命。

随机写起步30-25万IOPS、与企业级SSD差别

这里延时的单位是毫秒(以下同),总队列深度16

WD SN850的随机写一样受SLC Cache影响。在上面图表的测试之前,我准备了TRIM之后的空盘。在全盘容量范围测试,这时看不到六、七十万那么高的IOPS,起步有一小段30万,然后保持大约15分钟的25万IOPS,再往后就降到10万以内。由于4KB小块写入的放大效应,SLC Cache中容不下像顺序写那么多的数据。

最“严酷”的压力在下面——如果是企业级SSD我们通常会这样测试:

在预先已经写满数据的情况下,SN850大多数时候超不过3万随机写IOPS,这个测试确实有些勉强消费级SSD了。如果有28%的闪存OP也不会是这个算法,下面我们简单参考下企业级SSD的水平:

Intel SSD P3700随机写IOPS测试曲线

上图中的文字有点小,大家可以点击放大,我也辅助说明下——测试曲线是4K随机写IOPS,纵坐标刻度从10万到40万,横坐标为时间3600秒(1小时),蓝色、橙色和绿色曲线分别对应并发/QD16、64和512。Intel P3700的4KB随机写IOPS最终稳定在标称的17.5万。

90温度保护、散热设计

大品牌OEM整机厂商有做系统化散热设计;对于不确定SSD表面气流速度的DIY用户推荐加装散热片的M.2固态盘;笔记本用户空间有限另论。

尽管在WD SN850官方规格里运行温度建议不超过70摄氏度,但实际当中不小心还是容易超过。

SSD的发热与持续负载密切相关,如上图:由于我在做3000MB/s以上的读I/O压测,未经优化时SN850已经自我报告接近80℃。

我手头这个WD SN850到达90℃左右才会触发降速保护,如果长期运行在高温下SSD的老化应该会加快一些,当然个人/普通商用与数据中心服务器的平均负载压力有很大不同。

本次测试我采取的应对措施是,在Dell 5820工作站BIOS中调高对应HDDZone区域的风扇转速,比如+30偏移量。如果不是前置热插拔SSD还有另一种散热解决方案:

Dell Precision Ultra-Speed Drive这种PCIe to M.2转接卡分为Duo(PCIe x8,双盘)和Quad(PCIe x16,四盘)两种,上图中就是后者,可以看到散热风扇的位置。

我之前手上有过一片Ultra-Speed Drive卡,上面配了4个WD SN730。

注:Dell PC和工作站的SSD默认出厂时只限定Class等级,如果用户想选择指定的品牌型号,需要提出CFI定制。

PCIe 4.0平台展望:从11代Core到服务器/工作站

Intel在PCIe 4.0平台的推出上落后,已经是个事实。目前有部分笔记本/商用客户端开始支持PCIe 4.0的NVMe SSD。

比如Dell Latitude 5520笔记本,以及Precision 3560移动工作站,在不选配独立显卡的时候,就可以有一个NVMe SSD直连11代Core CPU的PCIe 4.0通道。

但我觉得这还远没有到普及的时候。首先高IOPS在桌面应用中并不多见,现有PCIe 3.0 SSD的带宽也可以满足绝大多数场景。

对于服务器和工作站的情况则不太一样,在多盘环境中,如果单盘性能提升则可能减少需要使用的SSD数量。除了现有的AMD平台,Intel 10nm的Xeon Scalable(Ice Lake-SP)也快点来吧:)

扩展阅读:《企业存储技术》文章分类索引(微信公众号专辑)

:本文只代表作者个人观点,与任何组织机构无关,如有错误和不足之处欢迎在留言中批评指正。进一步交流技术可以加我的微信/QQ490834312。如果您想在这个公众号上分享自己的技术干货,也欢迎联系我:)

尊重知识,转载时请保留全文,并包括本行及如下二维码。感谢您的阅读和支持!《企业存储技术》微信公众号:HL_Storage

长按二维码可直接识别关注

QQ群号:763628645

QQ群二维码如下, 添加请注明:姓名+地区+职位,否则不予通过

PCIe 4.0 SSD测试:接口、散热和CPU对性能的影响相关推荐

  1. 英韧科技PCIe 5.0 SSD主控4K随机读延时12us,为目前市场最低

    2023中国闪存市场峰会(CFMS 2023)于3月23日在深圳举行,本次峰会以"探讨未知•探索未来"为主题,齐聚全球领域内核心的存储产业链厂商.终端应用领域企业的负责人和高层管理 ...

  2. [转帖]影驰首发PCIe 4.0 SSD:群联AMD合作主控飚出5GB/s

    影驰首发PCIe 4.0 SSD:群联AMD合作主控飚出5GB/s https://www.cnbeta.com/articles/tech/851275.htm 硬件发展的真快.. AMD刚刚发布的 ...

  3. usb3.0 ssd 测试软件,当USB3.0遇上SSD,TB败得移动硬盘盒测试

    原生USB3.0从出现到成熟的这段时间,USB3.0设备的成本大幅降低,已经足够普及应用了.USB3.0的U盘与移动硬盘已经并不比USB2.0贵多少,而提升的速度是相当可观的.入门的一些移动硬盘盒也已 ...

  4. 神威计算机主板型号,十代酷睿高端型Z490主板曝光 总线规格依旧是PCIe 3.0且USB接口并不支持USB 3.2...

    Intel Comet Lake-S系列十代酷睿桌面版即将发布,接口更换为新的LGA1200,主板也需要搭配新的400系列芯片组,包括Z490.H470.B460.H410等型号,这些都已经毫无悬念, ...

  5. usb3.0 ssd 测试软件,对比评测告诉你USB3.0+SSD能否干掉HDD

    [IT168 评测]在2008年底,USBIF正式发布了USB 3.0规范,其在规格上经过了大幅度的提升,接口速率从USB 2.0的480Mbps一举跃升到5Gbps,提升幅度超过了十倍,这将充分满足 ...

  6. usb3.0 ssd 测试软件,Msata SSD转USB3.0的盘盒不完全测试

    本帖最后由 zazo 于 2015-6-13 00:26 编辑 10年海淘的X230,自己换的Intel 525系列120G Msata SSD,原500G的机械硬盘保留.卸载原英文win8 Pro, ...

  7. usb3.0 ssd 测试软件,SSD打造的移动硬盘,顺便测下USB2.0、USB3.0、SATA2.0、SATA3.0传输速度...

    本帖最后由 神经病的春天 于 2014-9-18 15:36 编辑 近来升级了一下主机,这样一来,终于能够拥有USB3.0和SATA3.0接口了,不过本人目前还木有SSD,所以尚无法完全发挥出这些接口 ...

  8. usb3.0 ssd 测试软件,板载性能:SATA3及USB3.0接口测试

    ●板载性能:SATA3及USB3.0接口测试 A85芯片组的原生SATA3接口史无前例的提升至8个,这对于对硬盘速度有着苛刻要求的用户有着非凡的意义.目前,只有A85和A75芯片组采用了全SATA3的 ...

  9. SATA硬盘性能测试软件,趣味测试:实测SATA线对硬盘性能的影响

    1不同主板附带SATA数据线对比 前言:随着硬盘技术的不断发展,SATAII接口已经逐渐成为了当前主流硬盘的必备接口.而具备热插拔特性.长度可达1米.拥有极小体积且安装和拆卸简单的SATA数据线,也取 ...

最新文章

  1. 47万实例数据集,智源联合旷视发布2020 CrowdHuman人体检测大赛
  2. 《TensorFlow技术解析与实战》——导读
  3. 关于动态生成输入界面的一些想法及实践
  4. boost::coroutine模块实现分段堆栈的测试程序
  5. SQLite数据库常用语句及MAC上的SQLite可视化工具MeasSQLlite使用
  6. ldconfig 和 ldd 命令用法
  7. 在浏览器中执行Kettle job或者transformation
  8. eMMC基础技术2:eMMC概述
  9. MacOS新版本,不能装老版本Xcode
  10. 关于Maven构建的项目依赖范围
  11. 华为NP课程笔记13-PIM
  12. 数据分析有 AI 帮你,Sugar BI 智能分析全场景介绍
  13. [Jenkins] docker-slim 容器瘦身的使用
  14. springboot大学校园网上图书馆信息管理系统的设计与实现小程序毕业设计源码091535
  15. btrfs + snapper快照使用
  16. java 变量 英文_java 变量(翻译自Java Tutorials)
  17. 使用 Learner Lab 建立 WordPress 网站 (EC2)
  18. 一款表达谱数据分析的神器--CCLE--转载
  19. C#开发简单绘图工具
  20. Java中两数交换引发的值传递问题及解决方案

热门文章

  1. 使用Java实现alpha-beta剪枝算法(井字棋小游戏)
  2. 2022年最新IDEA下载教程
  3. 【洛谷】P1747 好奇怪的游戏(bfs)
  4. Springboot (持续更新)
  5. python cox回归_数据分析|回归分析(RPython)
  6. 抖音无水印解析网站精美源码-无需数据库 安装
  7. IE11升级(不联网模式)之P处理
  8. XML文件介绍,这也太简单了
  9. java exception 乱码_java如何解决乱码问题
  10. 计组 - 加法器:进位链