当前的数据中心空间和功耗预算正尽力满足前所未有的数据增长,以及对足够存储性能的需求,以便将数据反馈给用户或人工智能训练模型。业界迫切需要高密度存储,以最大限度地利用现有数据中心空间。 当 HDD 领域正在努力寻找提高密度和性能的方法,Solidigm 的 3D NAND QLC SSD 自 2018 年投产以来,就已经实现了这两项目标。 凭借最新的 61.44TB D5-P5336 3D NAND QLC SSD,Solidigm 推出了迄今为止最大容量的 NAND 驱动器,其成本和性能优势可帮助数据中心实现更高的密度。 适用于混合工作负载的 CSAL + 高密度驱动器 Solidigm D5-P5336 等高密度 QLC SSD 已经为读取密集型应用带来了益处,那么对于混合工作负载和数据放置应用又如何呢? 为了进一步扩大高密度 Solidigm 61.44TB SSD 在混合工作负载和新兴 NVMe 设计(如数据放置技术,比如流、灵活数据放置 (FDP) 和分区命名空间 (ZNS))方面的应用优势,Solidigm 团队正在利用 CSAL(云存储加速层),这是存储性能开发工具包 (SPDK) 中的一个新的开源云级共享无存储软件层(bdev,即块设备)。 CSAL 支持灵活设计,可提高整个平台的 SSD 耐用性。这使得该解决方案能够通过新兴存储级内存 (SCM) SSD(如 Solidigm 的第一代 D7-P5810)保持较高的应用写入性能,并且,通过利用低成本和高密度 QLC 存储,同时利用 Solidigm QLC SSD 提供的 TLC 等效读取性能,可以优化 TCO。[1] 图 1 显示了内存分层结构,最慢的层位于金字塔底部,最快的层位于金字塔顶部。
在传统的缓存架构中,高性能存储(如存储级内存 (SCM) SSD)放置在主存储(如 QLC SSD)之前。数据写入缓存层后,系统会立即向用户或应用程序确认写入,而不是直接将数据写入主存储。然后,数据被写回到容量层。
传统缓存可以帮助高密度 NAND 介质保持每 TB 的写入性能,并提高高时间局部性工作负载的耐用性。例如,高性能、高耐用性的 SCM 层可以吸收频繁更新的写入,而无需将其发送到 QLC NAND 层。
CSAL 的关键策略是利用 SCM SSD 作为缓存,将用户随机写入压缩并形成 SSD 友好写入。CSAL 设计的目标是最大限度地减少 NAND SSD 的系统级写入放大和损耗,从而提高基于 NAND 主存储的整体性能和系统耐用性。
CSAL 在三个方面改进了传统的缓存技术:
下图 2 显示了传统写入缓存与写入整形缓存之间的主要区别。
在给定的场景中,CSAL 在高性能存储系统的 SPDK 中实现。SPDK 提供了从逻辑卷、通用块层到 NVMe 驱动器的全栈存储系统。CSAL 在 SPDK 块层中实现,并以虚拟块设备的形式公开,该虚拟块设备由两个物理块设备组成:
存储应用程序,如 NVMe-oF (NVMe over Fabrics),可以使用此虚拟块设备作为通用块设备。
图 3 显示了 CSAL 的整体架构。其中有几个要点需要强调:
To achieve the above data transition, CSAL manages four key components:
CSAL 软件解决方案架构不局限于任何特定的硬件架构,可以部署在包括 Intel、AMD、ARM、IPU/DPU、GPU 等在内的各种服务器架构上。我们渴望看到开源社区的参与和对各种架构支持的有机增长。
CSAL 是一种写入整形缓存,可释放高密度 NAND 闪存介质的价值。通过利用主机端 FTL,CSAL 保留了现有的软件接口,同时将任何写入工作负载转换为顺序写入工作负载。此外,CSAL 还能在 P5810 SSD 上缓存频繁更新或临时数据,从而最大限度地降低写入频率。
通过这两种策略,CSAL 增强了整个平台的耐用性并提供了应用性能。CSAL 是一种软件定义的灵活存储架构,适用于下一代媒体和数据放置技术。它很容易在数据中心进行横向扩展,并且可以轻松调整以满足各种性能和 TCO 要求。
[1] https://www.solidigm.com/products/data-center/d5/p5336.html
IDC 全球 DataSphere 预测,2022 年 5 月
Open-CAS / standalone-linux-io-tracer
Sarika Mehta 是存储解决方案架构师,拥有 15 年以上的存储经验。她致力于与 Solidigm 客户和合作伙伴密切合作,以优化其存储解决方案的成本和性能。 Kapil Karkra 是 Solidigm 的高级首席工程师兼首席存储平台架构师,负责云存储加速层 (CSAL)(基于主机的 FTL)的架构。他目前的工作重点是定义一个包括软件和硬件在内的交钥匙参考存储平台 (RSP),该平台有助于深入了解云计算用例,并加快高密度 NAND 固态硬盘的开发和采用。Kapil 拥有超过 25 年的存储经验,并拥有超过 20 项专利申请/授权。Kapil 拥有印度国家理工学院 (NIT) 电气工程学士学位和亚利桑那州立大学 MBA 学位。 Wayne Gao 是一名存储解决方案架构师兼首席工程师,曾参与从 PF 到 Alibaba 商业版的 CSAL 项目。作为前 DellEMC ECS 全闪存对象存储团队成员,Wayne 拥有 20 多年的存储开发经验,拥有 4 项美国专利申请/授权,发表了 1 篇 EuroSys 论文。