多年来,IT 存储介质领域涌现了大量创新。像该领域的许多人一样,我自己的从业经历也很漫长。这一历程始于磁带等介质,随后过渡到硬盘驱动器 (HDD),最终是基于闪存的固态硬盘 (SSD)。 任何存储介质的技术属性,最终都是推动 IT 行业采用此类介质的关键因素。决定任何存储介质在市场上取得成功的因素有很多,但底层技术及其存取方式至关重要。 现在,就让我们来看看对 IT 至关重要的存储介质的几个技术特征。
可用存储空间的大小需要匹配或超过数据占用量。这可以是纯物理或原始存储容量,也可以仅仅是设备向操作系统 (OS) 或存储系统呈现的容量。压缩和其他数据缩减技术使得“逻辑”容量可超过物理容量。数据保护可能会产生相反的效果,由于需要通过冗余来保护客户数据免受介质故障的影响,从而减少了逻辑容量。
在考虑部署的整体速度时,存储性能的影响往往被忽视。对于大多数用例,速度通常以首字节数据时间来衡量,也称为存取时间、延迟或响应时间。这可以是持续的驱动器吞吐量,也可以是两次活跃存取之间的时间量。在数据持久化(存储中最关键的部分)的写入环节,也有类似的衡量指标。
所有存储设备在进行实际工作时都需要消耗电力。通常在闲置和读/写输入输出 (I/O) 工作负载期间测量此类能耗。由于用于人工智能 (AI) 的计算资源(中央处理器 (CPU) 和图形处理器 (GPU) 在数据中心总能耗中占比越来越高,IT 业界不得不对基础设施其他部分的功耗采取创新性的解决方案。
当数据被写入存储介质后,数据必须能够被重新读回,这是存储可靠性的最低要求。目前业界有几种公认的存储可靠性衡量指标,包括误码率 (BER) 和平均无故障时间 (MTBF)。此外,对于 HDD 和 SSD 的某些新增特性,现在还加入了每日驱动器写入量 (DWPD) 和总写入字节数 (TBW),用以表示存储设备的耐久性。
多年来,主数据中心存储解决方案经历了多次变革。从穿孔卡片开始,后来发展到磁带,再到 HDD,现在是 SSD。正是这种从 HDD 到 SSD 的变革,正在重塑当今的企业存储市场。
数据中心存储时代主要始于基于磁带的解决方案。随着首批房间大小的解决方案问世,磁带逐渐消亡,取而代之的是 HDD。此后几十年,HDD 与磁带一同主导了企业存储介质市场。
有趣的是,磁带在 70 年代和 80 年代几乎被宣判死亡。不过,磁带仍被用于大量归档数据,即所谓的“冷”存储或“冻结”存储。它的存在是为了满足云和/或高性能计算 (HPC) 机构的需求,这些机构至今仍需处理世界上现存的艾字节 (EB) 到尧字节 (YB) 级别的数据。
要理解这一点,似乎有必要讨论一下上述不同存储解决方案的独特功能。首先,我们需要以一种独特的视角来看待磁带、HDD 和 SSD 的基础知识。
导致磁带衰落的一些特征包括:
除了归档用途外,磁带仍用于云/HPC 数据中心的另一个原因是其能耗和寿命。本质上,磁带在未卸载状态下功耗为 0W,且介质寿命 >10 年。
HDD 的市场应用范围也正在收窄,逐渐转向利基市场。与磁带一样,类似的问题也在影响着磁盘。此类问题与诸如主轴、盘片和马达等活动部件密切相关。甚至 HDD 的接口也是一大难题:
目前 HDD 的出货量仍然很大,并且还将持续一段时间,但就像磁带一样,这些产品主要流向超大规模企业和其他拥有 EB 到 YB 级数据的客户,这些数据需要归档,而不是主动存储。
换个角度看,SSD 和闪存技术市场正在全面繁荣。为什么?
新的 AI 低延迟存取方法和接口协议以 SSD 为目标:由于 SSD 的底层介质是半导体技术,可以电子速度进行存取,并能提供微秒级的响应时间。SSD 的持续吞吐量通常为 3 GB/秒 到 4 GB/秒 或以上。SSD 吞吐量取决于闪存集成电路 (IC) 内部的并行性、封装中闪存 IC 的数量以及 SSD 中闪存封装的数量。这使得提高驱动器吞吐量比 HDD 或磁带容易得多。如需了解有关封装的更多信息,请参见我们的文章: 《Solidigm 如何推动 SSD 封装技术的创新基石发展》
提高 SSD 容量虽极为困难,但并非不可能:本质上,提高 SSD 物理容量有三种方法:介质扩展、封装扩展和每单元比特数扩展。最早的 SSD 使用单 (1) 层单元 (SLC)。目前则发展为三 (3) 层单元 (TLC) 和四 (4) 层单元 (QLC) 设备。目前市售的闪存设备已堆叠(3D NAND)至高达甚至超过每裸片 200 个闪存层。考虑到所有的扩展,确定闪存的 Gbpi2 是一个移动的目标,但通常 SSD 为 15 Gb/mm2 (~9,600 Gbpi2) 或以上。如前所述,每个封装中可以包含不止一个闪存 IC。Solidigm™ D5-P5336 QLC SSD 支持 122.88TB 的物理存储容量。
SSD 生态系统正逐步扩张:NAND 闪存基于半导体,从而令更多公司致力于推进半导体技术,并推动至少一部分 SSD 生态系统的发展。虽然主要供应商只有几家(5 家且在增长),但支持组织的生态系统规模更大。
SSD 具有所有存储介质中最快的存取时间(微秒级)、最高的总容量和 Gbpi2、最高的吞吐量(>4GB/秒/驱动器)、最低的单位存储能耗 (TB/W) 以及扩张最快的技术生态系统。因此 SSD 正在占据当今 IT 存储市场的主导地位也就不足为奇了。
重要的是要意识到,应用程序是 IT 存储介质采用的主要驱动力之一。磁带从数据中心跌落神坛的一个原因是应用程序演变为开始使用随机存取存储器 (RAM)。在该系统之前,用户需要批量输入/批量输出,这推动了顺序存取技术的发展。对随机存取的需求为 HDD 成为主要存储类型创造了机遇。因此,企业应用程序及其存取模式的变化对 IT 存储介质的采用有着巨大的影响。
当前,对企业 IT 应用程序冲击最大的变化是 AI。它在过去十年间的出现令许多企业措手不及,但到现在,AI 的采用已是全速推进。
但不仅仅是 AI 部署 在推动企业应用程序的变革。5
其他一些关键因素包括:
拥有能够跟上这些趋势的低功耗、更快且更高容量的 SSD 存储变得更加至关重要。
存储介质的转型在数据中心并不频繁发生。有时很难预测,但如果仔细观察,是可以确定趋势的。
SSD 已经存在了几十年。但是,与以前让应用程序专注于访问模式的努力不同,通过 SSD 中的存储介质,AI 企业存取能够按照与 SSD 相吻合的方法/接口协议进行定制,从而将 HDD 远远甩在后面。此外,SSD 的原始容量正在超越所有其他存储介质,鉴于 SSD 的低能耗,其正迅速成为任何采用 AI 的前沿企业的首选存储介质。
磁带在被“宣判死亡”后仍存在了约 50 年。HDD 仍然存在,但业界也只能将其用于归档,直至被完全淘汰为止。SSD 确实是唯一能够跟上企业级应用程序加速变化步伐的存储介质解决方案,尤其是在各公司转为将更多 AI 纳入其数据中心工作负载这一趋势下。
Scott Shadley 是 Solidigm 的领导叙事总监和传播者,关注推动应用前沿存储技术,包括计算存储、基于存储的 AI 和后量子加密。Scott 在半导体和存储领域拥有超 25 年经验,在工程和关注客户方面均从事过重要职位。