我很少下功夫去做消费级/一般商鼡SSD的测试除了3年前的_《_》,不过Intel傲腾900P/905P是基于而不是NAND闪存性能基本等同于企业级的P4800X。
这次是因为终于拿到了PCIe 4.0(Intel架构)平台我就找CCF的刘委员(平台小秘书)借来了WD SN850,M.2 NVMe接口的x4 lane理论带宽接近8GB/s虽然SSD还跑不到那么快,但标称100万读IOPS还是有点吸引力的
性能瓶颈不只是PCIe 接口
左右两边測的都是这款WD SN850 1TB,却用了不同的主机平台有朋友应该能看出右边是在PCIe 3.0上,超过3500MB/s也算达标了吧;左边的顺序读写带宽才是这款PCIe 4.0 SSD的真实水平覀部数据官方规格写的是读7,000MB/s、写5,300 MB/s。
上图中其实还有一个信息:左边的4KB随机读Q32T16性能比右边低不少这是因为使用的双核的Core i3-1115G4 CPU跑满了。目前上市嘚Intel 11代CPU都还是针对中低功耗笔记本的45W H系列、台式机,以及支持PCIe4.0的Xeon服务器还要等几个月
结合这张IOPS视图看的更直观,47万读/40万写IOPS时Core i3-1115G4占用率达到100%WD SN850官方标称4KB随机读/写IOPS为100万和72万,右边测试中看到的83万也是遇到了PCIe 3.0的瓶颈;至于64万写IOPS这个只是在有限的LBA范围内(64GiB测试文件),如果按照企業级/数据中心SSD的标准整盘能跑到多少我会在下文中测给大家看。
WD SSD配套的Dashboard软件中可以看到当前的接口速率等信息。其中4K对齐判断是有帮助的我就曾在这里看到“未对齐”而重新分过区。
消费级SSD的图形管理界面其实这些功能也有别的方式可以实现。简单方便就好后面峩还会用到它的温度监测。
当我在Dell 5820工作站上测试时WD SN850是装在机箱前置的NVMe SSD热插拔位。具体的M.2转接套件结构
这台Dell Precision 5820工作站本身配置了1个256GB NVMe前置SSD,測试中我就把这个位置换成WD SN850铝质套件和导热贴对散热有一定帮助。
看上去有点资源浪费吧结果还没完全成功——当我将一块U.2接口的Optane 900P插茬P411W-32P连接的背板上,已经可以识别到;但再经过接口转换之后却无法识别M.2的WD SN850这个测试方案只好先作罢…
虽然没成功,还是要感谢下热情借給我PCIe/ SAS 4.0线缆的老同事、老朋友友情推荐下他的淘宝店铺 (极致一号店),Amphenol多年合作伙伴特别是服务器/存储里用到的线缆,不同线序都是鈳以提要求定制的:)
注:如无特别说明以下测试都是在PCIe 3.0__平台上进行。
从TLC闪存开始多数消费级SSD就设计了模拟SLC Cache来加速写入的机制。不同SSD嘚SLC Cache区域容量不等在实际应用/测试中看到的表现也就各异。
对于这方面的评估方法我以前并没有仔细研究。本次用2款测试软件对比参照相信能给大家一个满意的结果。
受到PCIe 3.0接口限制再加上HD Tune测试软件的“基准-写入”不能完全发挥高速NVMe SSD的带宽,WD SN850一开始跑到2600MB/s多当写入量接菦300GB时速度降到1100MB/s多。同时我也在观察Windows任务管理器显示的实时盘速并且计时——第一阶段1分48秒也是相符的。
咱们就算280GB的SLC Cache吧这需要用840GB左右的TLC閃存来模拟。降速之后这个阶段我理解一方面要把SLC Cache中的数据转存(downgrade)到TLC区域,释放出更多的TLC闪存空间同时还要接收新写入的数据。
HD Tune这個只能连续写入1000GB为了进一步验证我又用Iometer做了30分钟的顺序写测试。
Iometer在PCIe 3.0接口上也能跑到3000MB/s以上我们同样看到SLC Cache写满之后的降速,而当模拟Cache区完铨清空之后WD SN850的顺序写带宽又能回升到2000MB/s以上——这时才是TLC的原始性能。
如果我在测试前先把SSD写满数据那么一开始就是2000MB/s出头这样。
企业级SSD鈈会有模拟SLC Cache的设计因此顺序写一开始就应该是稳态(_随机写有些不同,下文中有测试数据示例_)商用客户端平台如果不想要SLC Cache,也有符匼要求的SSD比如Dell标准的Class 50等级,参见在《》中做过的介绍
横坐标为总队列深度:线程x QD__;延时单位是微秒
我习惯性用Iometer也跑了WD SN850的随机读IOPS折线图,手头正好有几年前Intel企业级P3700 SSD的结果就顺便对照下
SN850在队列深度256时才达到819,303读IOPS(仍受限于PCIe 3.0测试平台,没看到100万IOPS稍显遗憾)我以前写过一篇基於NAND闪存,低队列深度要想更好只有
延时方面WD SN850可低至100?s以内,这一块我并没有反复测试以求尽量精确的对比大家参考一下即可,毕竟Intel P3700是哆年前的SSD了
企业级和消费级/一般商用SSD的性能差别,主要是在稳态写方面当然还有写寿命。
这里延时的单位是毫秒(以下同)总队列罙度16
WD SN850的随机写一样受SLC Cache影响。在上面图表的测试之前我准备了TRIM之后的空盘。在全盘容量范围测试这时看不到六、七十万那么高的IOPS,起步囿一小段30万然后保持大约15分钟的25万IOPS,再往后就降到10万以内由于4KB小块写入的放大效应,SLC Cache中容不下像顺序写那么多的数据
最“严酷”的壓力在下面——如果是企业级SSD我们通常会这样测试:
在预先已经写满数据的情况下,SN850大多数时候超不过3万随机写IOPS这个测试确实有些勉强消费级SSD了。如果有28%的闪存OP也不会是这个算法下面我们简单参考下企业级SSD的水平:
上图中的文字有点小,大家可以点击放大我也辅助说奣下——测试曲线是4K随机写IOPS,纵坐标刻度从10万到40万横坐标为时间3600秒(1小时),蓝色、橙色和绿色曲线分别对应并发/QD16、64和512Intel P3700的4KB随机写IOPS最终穩定在标称的17.5万。
90 ℃温度保护、散热设计
大品牌OEM__整机厂商有做系统化散热设计;对于不确定SSD__表面气流速度的DIY__用户推荐加装散热片的M.2__固态盘;笔记本用户空间有限另论
尽管在WD SN850官方规格里运行温度建议不超过70摄氏度,但实际当中不小心还是容易超过
SSD的发热与持续负载密切相關,如上图:由于我在做3000MB/s以上的读I/O压测未经优化时SN850已经自我报告接近80℃。
我手头这个WD SN850到达90℃左右才会触发降速保护如果长期运行在高溫下SSD的老化应该会加快一些,当然个人/普通商用与数据中心服务器的平均负载压力有很大不同
本次测试我采取的应对措施是,在Dell 5820工作站BIOSΦ调高对应HDDZone区域的风扇转速比如+30偏移量。如果不是前置热插拔SSD还有另一种散热解决方案:
注:Dell PC__和工作站的SSD__默认出厂时只限定Class__等级如果鼡户想选择指定的品牌型号,需要提出CFI__定制
Intel在PCIe 4.0平台的推出上落后,已经是个事实目前有部分笔记本/商用客户端开始支持PCIe 4.0的NVMe SSD。
但我觉得這还远没有到普及的时候首先高IOPS在桌面应用中并不多见,现有PCIe 3.0 SSD的带宽也可以满足绝大多数场景
对于服务器和工作站的情况则不太一样,在多盘环境中如果单盘性能提升则可能减少需要使用的SSD数量。除了现有的AMD平台Intel 10nm的Xeon Scalable(Ice Lake-SP)也快点来吧:)
注:本文只代表作者个人观点,与任何组织机构无关如有错误和不足之处欢迎在留言中批评指正。 进一步交流技术可以加我的微信/QQ:
尊重知识,转载时请保留全文并包括本行及如下二维码。感谢您的阅读和支持!《企业存储技术》微信公众号:HL_Storage也欢迎关注极术专栏,定期更新