入门级PCIe4.0 SSD风向标--Lexar NM760 1TB SSD评测

入门级PCIe4.0 SSD风向标--Lexar NM760 1TB SSD评测
2022年05月14日 21:30 什么值得买

作者:gaojie20

前言

 PCIe4.0 x4规格的SSD的真正普及是需要一个成本优化的趋势去推动了,而这个趋势我认为就是Dramless,无缓存方案。

 我们回头去看看PCIe Gen3x4的SSD产品,因为要便宜要缩减成本,所以无缓存方案就成为最佳的成本方案,有缓存的方案因为成本也逐渐有序的减产或者被停产进行转型,此时市面上大量的群联PS5018-E13T,慧荣SM2263XT以及InnoGrit IG5216主控的就成为最佳的选择,而大厂WD也急忙推出了自己的无缓存产品SN570去应对低价策略。

 类似的情况在今天也同样发生在PCIe Gen4x4的SSD产品上,由于AMD和Intel大力推进PCIe Gen4的标准,PCIe Gen4x4的SSD需求明显增加,高阶用户毕竟不是主流,中低阶用户才是这个市场的主流,所以主打性价比的PCIe Gen4x4的入门级SSD产品才是这个市场呼声最高的产品。

 所以PCIe Gen4x4规格的Dramless无缓存方案的SSD产品如雨后春笋一样勃发,涌入市场,各家都希望能占据这个主流市场。诸如WD的SN770,Plextor的M10E都是这条产品线中的廉价且可靠的主力产品,而Lexar NM760就是Lexar应对这条线推出的主打。

▲江波龙从美光科技收购“Lexar”品牌其实是一笔很划算的买卖,美光本身有两家品牌公司,Crucial和Lexar,个人感觉Lexar品牌的定位以及商业价值可能比Crucial更高一些,产品的附加值也更高。

▲消费者更关注的问题是Lexar被江波龙收购之后是否还能提供出高质量的存储产品,我个人对Lexar产品抱有较大的研究兴趣,所以也曾购买过不少SSD和DRAM产品,所以也带来到了今天评测的对象,Dramless无缓存方案的PCIe Gen4x4产品:Lexar NM760 1TB SSD

开箱

▲包装正面
▲包装背面
▲包装侧面
▲开盒全家福
▲SSD本体正面
▲SSD本体背面,很明显这是一款单面设计的SSD。

产品解析

▲首先我揭去贴标暴露SSD的PCB,因为是无缓存单面SSD方案,所以NM760 1TB SSD使用了一颗主控以及两颗NAND,并没有缓存芯片。也就是我们常说的Dramless SSD。

主控

▲首先来说下这颗主控SM2269XT

SM2269XT是一颗由SMI慧荣出品的PCIe Gen4 X4 Dramless无缓存主控,支持NVMe 1.4协议,SoC内置ARM Cortex-R8双核心CPU,运行频率650MHz,支持4通道,每通道支持4CE,最高每通道可以传输1600MT/s的速率。

 前作中我评测的Plextor m10e 1TB采用的是SM2267XT无缓存主控,那么这两颗主控的区别是什么呢?

1、制程差异

同为SMI出品的PCIe Gen4X4  Dramless无缓存主控,但是SM2267XT是28nm 制程工艺制造,SM2269XT是12nm制程工艺制造。

 2、规格差异

SM2267XT SoC部分使用了双核心ARM Cortex R5处理器,NAND支持4通道,每通道4CE,NAND IO接口速度为1200MT/s,

SM2269XT SoC部分使用了双核心ARM Cortex R8处理器,NAND支持4通道,每通道4CE,NAND IO接口速度为1600MT/s,

 2、能耗比差异

SM2267XT主控芯片在同样功耗下的平均性能为 1500MB/s,在 4000mW 平均功耗时,则是能够达到 3500MB/s。 SM2269XT 主控芯片在功耗和性能比方面更为出色。同为 3000mW 平均功耗,SM2269XT 主控芯片拥有高达 3500MB/s 的性能,在达到 4000mW 平均功耗时,性能方面更是能够达到 5000MB/s。

NAND

▲NAND是longsys RC72TAA1442512G

▲通过SMI NVMe SSD Flash ID V0.26A检测,Bank00-03为NAND1,Bank04-07为NAND2,均显示为Micron B47R 176L,单Die为512Gb(64GB),两个Die共享一个CE,所以单颗512GB的NAND有8Die 4CE组成。

所以两颗NAND就是4通道共8CE,塞满SM2269XT的4通道,但是CE只塞了一半。

 如果说到今年的NAND,美光B47R绝对是一枝独秀。B47R是美光第二代RG替换门架构闪存,也是美光的第五代产品,美光首批 176 层 3D NAND 采用了将双 88 层融合到一起堆叠成512Gbit TLC 的Die,然后多Die再堆叠成不同容量。,因为换用电荷陷阱存储单元的方案,极大地降低了每一层的厚度。 176 层裸片Die厚度仅为 45 μm,较三星等竞争对手领先30% 。读写延迟方面,分别较自家96/128层NAND 改善了35% /25%以上。

 B47R主要分为三类:

 1、B47R-R FortisFlash TLC:IO为1600MT/s,PE为3000,主要用于PCie Gen4主控产品。

2、B47R-M FortisFlash TLC:IO为1200MT/s,PE为1000,主要用于PCie Gen3主控产品。

3、B47R FortisMax TLC :IO为1600MT/s,PE为10000,主要用于企业级SSD产品。

 因为要挂SM2269XT,所以肯定把IO要挂到1600MT/s来满足主控需求,因此这颗NAND不难推测出指标:

 这颗NAND可能是由longsys采购的Micron 3D TLC 176-Layer B47R-R FortisFlash的wafer并自行封装的 4Tb(512GB) 3D TLC NAND,8die,4CE,独立2通道,3000PE,IO支持1600MT/s的传输速率。

测试平台

 CPU:AMD Ryzen 7 5800X

主板:ASRock X570S PG Riptide

内存:Apacer Panther Rage RGB DDR4-3200 C16 16GBX2 

SSD:Samsung SM961 1TB M.2

散热:Thermalright Frozen Magic 240

显卡:ZOTAC Geforce RTX3060 12GB

电源:Seasonic Focus GX650

机箱:SilverStone RM42-502

Windows 10 Workstation Edition X64 20H2

Ubuntu 19.04 X64

WINDOWS测试部分

 官标

NM760 1TB的官标参数中比较重要的几项:

1、TBW=1000TB

2、持续读取最高5300MB/s,持续写入最高4500MB/s

3、提供五年质保

TBW

▲测试中期CrystalDiskiinfo 8.12.1检测的SMART信息。

从这里的写入量来看的话,主机写入量总计75.158TB,写入单位计数在157.62TB,目测写放大在2左右,寿命消耗在81-82%之间,参数收紧一点假设寿命消耗是9%,换算出来的FW的寿命计算为75.158TB/0.09=835.09TBW,参数放松一点假设寿命消耗是8%。换算出来的FW寿命计算为75.158TB/0.08=939.48TBW,而Lexar官标寿命是1000TBW。

 性能定标

 官标参数性能是很有必要的一件事情,我相信很多人测试过测试条件很关键,自己可以尝试测试对应的QD深度和T线程数,可以摸到了这个极限,如下图:

▲CrystalDiskMark 8.0.24的持续读写使用QD32T1的默认设置,随机读写使用QD32T16的条件,可以非常接近官标所标识的UP TO的最大值:

 Sequential Read  [持续读取](Q=32,T=1) : 5260 MB/s

 Sequential Write [持续写入](Q=32,T=1) :  4498 MB/s  

因为官方没有标注随机读写的参数,这里顺手我把随机读写的上线标出来:

 Random Read 4KiB [4K随机读取](Q=32,T=16) :  421K IOPS

 Random Write 4KiB[4K随机写入] (Q=32,T=16) :  929K IOPS

可以看出持续读写成绩非常接近官标参数。随机读写我定标出来的结果也还是不错的,这里给大家一个参考。

 天堂和地狱

 有了以上的经验,我有点怀疑官方针对4K QD32 T16有特殊优化,所以继续用这种天堂和地狱的手法进行其他软件和版本的对比,结果如下:

▲AS SSD Benchmark 2.0.7316.34247默认设置下的空盘1GB数据块和96%满盘下10GB数据块的测试对比,可以很直观反应在该软件最大压力限制范围内磁盘最好和最差的表现。10GB数据块下的压力感觉还不够大,不能压到最低效能。

▲CrystalDiskMark 5.0.2 默认设置下的空盘1GB数据块和96%满盘32GB数据块的测试对比,配置使用持续读写Q32T1和随机读写Q32T16,可以很直观得使用软件的最大压力限制反应磁盘在该软件下最好和最差的表现。

 32GB数据块测试结果反映持续写入以及随机读写的衰减是显而易见的存在。

 这个测试带我们走过厂商宣称的最好效能和我们实测的最差情况下的效能参数对比,体现了一个SSD在3D TLC NAND调教、主控固件平衡以及盘内容量大部分写入情况下的综合能力。

 SLC Cache验证

 DATAWRITE是我的一个大神级程序员朋友pufer在谈笑间写出的一个小程序,用于验证2D 3D TLC真实写入速度的。规则是使用随机模式QD1深度随机往SSD里面以1GB数据块大小为单位写入并且反馈即时的写入速度,这个软件当时我们开玩笑说的是,大部分的测试软件都在RAW格式下测试写入速度有失偏颇,那么我们能否直观一些在NTFS格式下进行一些动态写入以获得初略的2D 3D TLC NAND真实的写入速度评估,这就是这个软件编写的初衷。

▲很直观,写入在160GB附近开始掉速,这就是大致的SLC Cache容量。

 URWTEST

▲URWTEST这个软件和前面的DATAWRITE有异曲同工之妙,不同的是他是使用随机模式QD1深度随机往SSD里面以2GB数据块大小为单位写入并且反馈即时的写入速度,写满了盘之后可以进行一次数据校验,校验的过程就是随机读取的过程,而校验的结果就是数据完整性的检测。这个测试更接近我们日常的应用等级。

TrimCheck 0.7

 TRIM CHECK是一款很实用的检测SSD是否TRIM生效状态的软件,TRIM指令让操作系统可以告诉固态驱动器哪些数据块是不会再使用的;否则SSD控制器不知道可以回收这些闲置数据块,TRIM可以减少写入负担,同时允许SSD更好地在后台预删除闲置的数据块,以便让这些数据块可以更快地预备新的写入。当然光操作系统支持TRIM不行,还需要SSD的固件支持。

▲向SSD里写入一个16M的文件,这文件头的前16位字节如上图白色区域所表示,这也是该文件唯一的文本字符串,然后将其删除,如果TRIM工作,控制器也将删除这个数据,这时候软件让你等待大约20秒后然后按ENTER继续,然后关闭软件再次打开。

▲再次打开软件,提示原白色区域的字节并没有被FF所填充,说明主控固件的TRIM机制有生效。

 SNIA PTS评估验证

 前面的测试都在NTFS格式下的桌面环境中测试,由于NM760 1TB固件的平衡能力以及160GB的SLC Cache,很难将其打落到到NAND本身的实际写入速度,即使在桌面环境的测试看起来结果还是不错的,我还是想看一下这个SSD是否能抗住企业级SSD标准化测试的残酷考验。

▲全球网络存储工业协会(Storage Networking Industry Association,SNIA)是成立时间比较早的存储厂家中立的行业协会组织,宗旨是领导全世界范围的存储行业开发、推广标准、技术和培训服务,增强组织的信息管理能力。作为一家非盈利的行业组织,拥有420多家来自世界各地的公司成员以及7100多位个人成员,遍及整个存储行业。它的成员包括不同的厂商和用户,有投票权的核心成员有Dell、IBM、NetApp、EMC、Intel、oracle、FUJITSU、JUNIPER、QLOGIC、HP、LSI、SYMANTEC、HITACHI、microsoft、vmware、Huawei-Symantec十五家,其他成员有近百以上,从成员的组成可以看出,核心成员来自核心的存储厂商,所以SNIA就是存储行业的领导组织。在全球范围SNIA已经拥有七家分支机构:欧洲、加拿大、日本、中国、南亚、印度以及澳洲&新西兰。

Solid State Storage Performance Test Specification Enterprise v1.0是SNIA于2011年给Enterprise SSD都制定了Performance Test(性能测试)的规范,可以到其网站溯源。

很少有人将一个消费级SSD推到极限的情况下去评估Perfermance效能,因为大部分的情况是掉成狗,有很多厂家是很忌讳使用SINA的标准SSD测试规范对他们的产品进行评估的,这个测试会将一切的外部加成全部忽略掉,将其打落到NAND本质的速度,进行严格的稳定态测试,如果性能浮动太大的话,可能永远无法达到稳定态直到测试中断,或者如果EARSE机制偶发性失效出现问题,这个测试也会中断,所以不是什么盘都能得到最终的测试结果,很多盘没跑完测试就已经被强制中断测试了,所以我很想知道这个盘以何种姿态通过测试或者不通过。

 在SNIA组织定义的规范中,规范了如何测试闪存设备或固态存储。业界希望有一种来比较SSD的科学方法,这也是需要SNIA测试规范的原因。SSD的写入性能在很大程度上取决于NAND的写入历史。SSD一般有三个写阶段:

1、FOB(全新从盒子里拿出来的状态)

2、Transition(过渡)

3、Steady State(稳定状态)

以上图例来自SINA PTS 1.1测试规范

 Transition(过渡)过渡是FOB和稳态的良好表现之间的阶段。大多数情况下,性能会随着时间的推移而持续下降,直到达到稳定状态为止。SNIA PTS1.1的测试规范则很严格的监控了FOB到稳定态的每一个阶段,以及评估标准帮你去确认你的企业级SSD确实达到了稳定态,所以根据以上溯源我们有了如下的操作:

 软件系统及设置

操作系统 : Ubuntu 19.04 Disco Dingo (development branch)

内核版本 : 5.0.0-11-generic

测试软件:  fio-3.12

Number of jobs: 2

Number of outstanding IOs (iodepth): 32

 为了避免在T16线程FW优化的套路里跑出很华丽的IOPS,所以这次使用了T2线程,进行测试。双核环境我相信是目前最广普的环境了。

▲该盘从FOB(全新从盒子里拿出来的状态)-Transition(过渡)--Steady State(稳定状态)的测试曲线,属于比较正常的状态。

▲该盘测试过程图谱记录,溯源测试的真实性。

 1、IOPS测试(IOPS)

 测试方法

进行Secure Erase安全擦除

预处理:128K持续写入双倍SSD容量

每一轮测试包含.512B,4K,8K,16K,32K,64K,128K,以及1MB数据块大小,每个数据块在100%,95%,65%,50%,35%,5%和0%运行读/写混合测试,各为一分钟。试验由25回合(Round)组成(一个循环需要56分钟,25回合=1400分钟)

使用4K随机写入的IOPS作为测试目标,写入振幅20%平均值与测量值线性最佳拟合线的斜率作为验证进入稳定态的标准。

▲IOPS稳态收敛图-QD32

显示相关变量如何收敛到稳定状态的过程

▲IOPS稳定态验证图-QD32

显示(14,15,16,17,18)回合进入稳态,进入的速度还是相对较慢。

这里需要说明的是,当性能特别稳定的盘上去,一般来说都是(0,1,2,3,4)直接进入稳定态了,而稳定性差点的盘上去,可能就在更多的回合进入了,4K随机写入性能浮动较大的盘如果不能控制在20%以内的话,那就永远通不过这个测试。

 所以这个环节,从FOB状态过渡到稳定态耗费了最大的回合,擦边临界通过。

▲IOPS测试2D图-QD32
▲IOPS测试3D图-QD32

 2、带宽测试(TP)

 测试方法

进行Secure Erase安全擦除

对于['1024k', '64k', '8k', '4k', '512']数据块大小进行持续读写60秒为一回合(Round)

使用1024K持续写入的吞吐量作为测试目标,写入振幅20%平均值与测量值线性最佳拟合线的斜率作为验证进入稳定态的标准

▲带宽稳态收敛图-QD32显示相关变量如何收敛到稳定状态的过程

数据块=1M时,读取最高达到6000MB/s,

数据块=64K时,写入最高达到3500MB/s,

▲带宽稳定态验证图-QD32

显示(13,14,15,16,17)回合直接进入了稳态,进去速度较慢,但满足验证标准给出了1M数据块下持续写入振幅20%平均值与测量值线性最佳拟合线的斜率的条件。

▲读写带宽测试2D图-QD32

我们可以看到稳定态下持续读写各个数据块下的平均表现力,1M数据块下持续读最大平均带宽4818.506MB/s,4k数据块下持续写最大平均带宽2420.079MB/s。

 3、延迟测试(LAT)

 测试方法

进行Secure Erase安全擦除

预处理:128K持续写入双倍SSD容量

 对于['8k','4k','512']数据块大小进行100%读,65%读35%写,100%写的随机读写测试,测量最大最小以及平均的延迟,60秒为一个回合(Round)

 使用4K随机写入的平均延迟作为测试目标,写入振幅20%平均值与测量值线性最佳拟合线的斜率作为验证进入稳定态的标准 

▲延迟稳定态收敛图-QD32显示相关变量如何收敛到稳定状态的过程

▲延迟稳定态确认图-QD32显示了4K随机写入过程中,在(9、10、11、12、13)回合达到了稳定态,进入稳定态的速度依然是较慢。

▲平均延迟在所有进程中的表现在0.6毫秒以内。

▲最大延迟在所有进程中的表现在200毫秒以内。随机读的部分是最大延迟很低的,控制在25毫秒以内,而只有随机写的部分最大延迟相对较高,其实200毫秒确实不能算低也不能算高,因为Lexar的消费级旗舰NM800 1TB的测试在这里达到250毫秒,我只能说这部分是有较大的FW优化空间的。

 这里涉及到的问题就是主控资源的充足度以及LDPC解码资源和耗费时间问题之间的平衡调节问题了,相对于3D TLC而言,写入部分的最大延迟普遍性高一些和以下一些因素有关:

 1、主控的资源,比如主控的主频以及核心数,ARM构架或者MIPS构架的实际效能。

 2、LDPC硬软解码的能力。

 3、主控固件的硬软件开发能力。

 那么如果需要举例说明的话,SATA盘中的SMI2258H主控+TSB 64层3D TLC的盘在这个测试中随机写最大延迟普遍在700毫秒以上,这样比较就可以更加明晰本款产品的效能定位。

▲平均和最大延迟3D图-QD32以及汇总数据。

 4、写饱和度测试(WRITESAT)

 测试方法

进行Secure Erase安全擦除

执行4K随机写入1分钟为一回合(Round),写入4倍全盘容量或者24h,以先达到者为准

计算各个回合的平均IOPS(Avg IOPS)

▲写饱和平均IOPS图-QD32

这个测试实际写入也就500轮写满4倍全盘容量,平均速度约在32500 IOPS,曲线很稳定几乎一条线。

▲写饱和平均延迟图-QD32

测试跑在2毫秒以内一直到测试结束,曲线很稳定几乎一条线。

 因为纯写入任务对缓存是有一定要求的,比如有缓存的NM800 1TB,在这里就可以达到60W的IOPS,延迟低到0.1毫秒附近,无缓存的盘这个环节性能天生就会大幅降低,包括SM2267XT无缓存主控的Plextoe M10E 1TB一样在这个环节遇到相同的大规模降速问题。

Secure Erase兼容性和有效性测试

 BIOS

 考虑到SM2269XT毕竟是新产品主控,我比较怀疑使用目前主板自带的Erase Tool对其进行Secure Erase操作的可行度,故此有了这个测试。

▲测试结论是使用ASRock Z590 TAICHI的bios自带的SSD Secure Erase Tool对SSD进行Erase操作,实测有效。

 Linux  cli

 在Ubuntu操作系统下输入第一条指令定位到盘,然后使用第二条指令对其进行Secure Erase

nvme list

nvme format -s 1 /dev/nvme1n1

▲结果显示Secure Erase成功!实测有效

 温度

▲测试情况就是简单的裸奔状态。

 我在Ubuntu下使用

sudo watch -n 1 nvme smart-log /dev/nvme1n1

这条命令来监控SSD的温度。

▲然后进行PTS IOPS的4K QD32随机读写测试,记录18小时的温度图进行分析,这个盘有两个温度感应器:
▲温度感应器2最高温度56.8度,温度感应器1最高温度为53.4度。
▲温度感应器2最低温度(待机温度)为35.9度,温度感应器1最低温度(待机温度)为26.1度。
▲温度最高温其实发生在128K持续写入环节,温度感应器2最高温度59.9度,温度感应器1最高温度为61.9度。

 通过这些数据可以摸到温度感应器1可能是NAND温度,温度感应器2可能是主控温度。

因为持续写入的时候,主控和NAND的压力都很大,所以温度都会很高,到了4K随机读写阶段,因为该盘的IOPS较低对NAND的压力较小,对主控的压力较大,所以NAND的温度会低于主控温度,由此推断出可能的情况。

 目前综合以上测试我所操作的写入压力并没有摸到这款SSD的降速温度线,其实是因为这款SSD的操作温度确实是低,非常适合笔记本用户使用。

总结

 1、目前作为PCIe Gen4x4 Dramless方案的最强硬体组合就是SM2269XT+Micron B47R-R,外加直接IO挂上了1600MT/s的光环加成,在我印象中应该是持续读写很强,随机读写稳定性较差,很可能过不去PTS测试,但是实测后发现也还行,顺利过了PTS稳定性测试。虽然基本都是在十几轮进入稳定态,但是毕竟是稳定性过关了,也是市面上为数不多的能过PTS验证的消费级Dramless SSD,这里的FW固件能力功不可没,Micron B47R-R如果IO挂在1600MT/s要调稳定其实很不容易。

2、SSD产品经理选品很重要,这取决于行业经验与专业知识,SSD而言,选错了主控,选错了NAND,而团队又解决不了FW固件问题,BUG会被无限放大,这个产品线就完了。幸运的是,产品经理貌似是选对了,虽然吃的螃蟹是国内第一款SMI2269XT的方案,但是产品表现还是可圈可点,我个人认为FW还有继续优化的空间,期待后续FW版本的表现。

3、Lexar品牌从美光转手到江波龙之后,SSD产品的闪存品质大家还是有在观望,以前Lexar用Micron原片,而现在用的是自封片,差异真实存在,这可能就是原厂的优势所在,Lexar自封片的品质如何有待市场长期的考验 。再说的透彻一些,要在这个市场立足,牢牢掌控自封片的品级至关重要,也正因为江波龙有自己的NAND封装厂,所以对NAND的品级是有掌控力的。保证采用高品级的NAND才是Lexar品牌的生存之道!

4、 Lexar SSD Dash这款APP制作进度严重拖后,跟不上新品的速度,目前最新的版本还是2011年发布的,适用于NM760也就是显示个SMART,WINDOWS下的安全擦除功能依然是不生效的。

5、NM760即使使用了PCIe Gen4x4 Dramless方案中目前最强的SM2269XT+Micron B47R-R组合,但是也没有给我太多的惊喜,性能中规中距,对市场积极的作用是提升了PCIe Gen4x4入门级产品的性能门槛,做了一个良性的示范。产品推出对市场风向的推导很重要,君子爱财取之有道,如果大家都不断降低PCIe Gen4x4入门级产品的下线,这个入门级的市场就会烂掉。

本评测无关导购,只涉及实事求是的反馈产品的情况,有意向消费者618可关注价格,目测价格有极大潜力,感谢观看!

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部