人工智能 (AI)、高性能计算 (HPC) 和边缘部署的融合要求数据处理基础设施采用创新方法。DUG Technology 作为高性能计算和浸没式冷却解决方案的领军企业,打造了 DUG Nomad - 一个突破性的集装箱式数据中心。当与 Hypertec 服务器和 Solidigm™ NVMe 固态硬盘结合使用时,DUG Nomad 可直接为边缘部署带来前所未有的计算能力。
此次合作展示了浸没式冷却技术、专用服务器和高性能存储如何改变边缘 AI 和高性能计算。
传统的数据处理工作流程需要将大量原始数据从远程收集站点传输到集中式数据中心进行分析,这一过程充满了重大挑战。
网络带宽限制了可传输的数据量
数据处理延迟会延缓关键决策
跨网络传输所有原始数据成本过高
试想在世界上最偏远、环境最恶劣的沙特阿拉伯沙漠中获取、处理和传输数据所面临的挑战。创新的边缘计算解决方案彻底改变了在孤立的移动数据采集站点的数据获取方式,实现了地震数据的超高效采集。
能够在实时数据流上运行计算密集型高级算法,使得实时分析成为可能。添加高密度存储解决方案可实现连续、不间断的运行,从而最大限度地提高效率并加快获取洞察的速度。
DUG Nomad 是一个集装箱式的浸没式冷却数据中心,可以部署在世界任何地方。该移动解决方案将高性能计算功能直接带到数据收集站点,从而在边缘实现实时处理和分析。
该系统提供多种配置,包括 10 英尺、20 英尺和 40 英尺的容器尺寸,10 英尺型号提供 26 个可用机架单元的计算空间。这些集装箱专为直升机运输而设计,具有集成吊装点,使其能部署到传统计算基础设施无法到达的地点。DUG Nomad 几乎可以在任何地方运行,因为它的工作温度范围为 - 40°C 至 + 50°C,并且采用防风雨密封设计,只需连接电源即可完全自主运行。
或许最令人惊叹的是,整个系统可以在两小时内完成部署并开始运行,从而立即在偏远地区提供数据中心级的计算和存储功能。
Hypertec 的贡献代表着从“适配浸没式”到“浸没式专属”服务器设计的根本性转变。Hypertec 不是将风冷服务器改造成适合液冷环境使用,而是从头开始专门为浸没式冷却设计服务器,从而实现了更卓越的性能、可靠性和效率。
这种浸没式专属设计理念体现在服务器机箱内组件的优化布局上。GPU 位于温度最低的箱体底部,而电源和其他发热组件则被战略性地布置以实现最高效率。专用材料包括专为特定冷却流体粘度而设计的定制散热片、在液体环境中不会降解的铟箔导热界面,以及通过浸没认证的电缆和连接器。Hypertec TRIDENT 浸没式专用服务器的内部机箱和布局经过精心设计,可引导冷却液顺畅流动并减少热点,确保热量均匀分布。定制散热器的翅片间距针对介电流体的较高粘度进行了优化,提高了循环效率和热传递效率。所有组件均经过严格的长期浸没性能测试,包括高加速应力测试 (HAST)、流体老化测试,以及抗溶胀、腐蚀和降解的兼容性测试。热界面材料 (TIM) 因其在浸没环境中的耐用性和导电性而被选中,支持系统长期稳定可靠运行。
密度表现令人瞩目。10 英尺的 DUG Nomad 型号提供 26 个可用的传统计算机架单元,可容纳不同高度的专用浸没式冷却箱。单个 26RU 冷却箱能够支持超过 50 台采用 AMD EPYC 或 Intel Xeon 处理器的现代 CPU 服务器,或者在 1RU 机箱中以 4 个 GPU 的超高密度配置,支持超过 100 个 H200 GPU。
可靠性指标表明,在一些部署中,超过四年的运行时间内未出现任何组件故障,稳定的工作温度消除了传统风冷系统中因热循环应力导致的组件劣化。DUG 的服务器(通常使用寿命为五年)在首次浸没九年后仍能平稳运行。
Solidigm NVMe 固态硬盘解决方案提供高性能存储基础,非常适合边缘人工智能和地震处理工作负载。紧凑的外形和卓越的性能特点,使其非常适合 DUG Nomad 系统这种空间受限且性能至关重要的环境。
Solidigm 与 DUG 和 Hypertec 合作验证了这一概念验证方案。目前的存储方案在单个 1U 存储服务器中利用 16 个 Solidigm E1.S 固态硬盘,每个存储节点提供约 320TB 的总容量。其扩展潜力巨大,支持 E1.L 规格后,单个 1U 服务器可提供高达 1.9PB 的存储容量。
高 IOPS 性能支持并行 AI 推理工作负载,而低延迟可实现实时决策。在边缘存储更多数据大大减少了将原始数据传输到远程处理中心的需求,从而使智能数据过滤系统能够显著降低带宽需求。
高性能计算 (HPC)、存储与冷却技术的结合,使得复杂的人工智能应用和计算密集型应用能够在边缘实现。 用例包括远程监控的计算机视觉处理、使用实时传感器数据的预测分析、需要低延迟决策的自主系统,以及直接在边缘数据收集站点进行的科学建模和模拟。
对于涉及敏感或机密信息的应用,边缘计算可提供设施内或国家/地区内的私密处理能力。
实时边缘处理大幅降低了原始数据传输需求,显著削减了云存储和带宽成本,同时加快了地质调查和勘探活动的分析速度。
与传统的风冷解决方案相比,浸没式服务器设计能实现显著的节能效果。《能源信息学》(Energy Informatics) 上发表的研究表明,浸没式冷却数据中心的能耗比风冷数据中心低多达 50%。DUG 在采用浸没式冷却数据中心设计后,整体功耗降低了 51%。仅取消服务器风扇这一项,就使总能耗降低了多达 25%。DUG 的能源使用效率 (PUE) 评级低至 1.02,而行业平均水平为 1.55 以上。稳定的低运行温度使处理器能够保持峰值效率曲线,避免了风冷系统中因热节流导致的性能下降和能耗增加问题。
使用单个移动单元替代建筑物内的多个固定设施,可在多个项目中最大限度地提高设备利用率。浸没式冷却可显著提高组件可靠性,降低更换和维护成本,同时在严苛环境中保持稳定的性能。
数据分析能力增强、设备故障风险降低、运营灵活性提高,让组织能够寻求传统计算基础设施无法实现的机会。
技术演进将通过存储领域的进步持续推进,包括向更高容量的 Solidigm 固态硬盘过渡、集成下一代 PCIe 协议,以及潜在的计算存储技术。计算平台的发展会将下一代 GPU 架构和专用 AI 加速器整合到更大的容器配置中,例如 DUG Nomad 40。
市场拓展机遇延伸至远程制造业和工业物联网应用、极端环境下的科学研究,以及计算资源快速部署至关重要的应急响应场景。
DUG Nomad、Hypertec 浸没式服务器和 Solidigm 高性能固态硬盘的结合代表了边缘计算基础设施的范式转变,通过将先进计算能力带到偏远和复杂环境,解决了根本性挑战。
通过结合各种架构技术中的多种创新解决方案,该解决方案表明,数据中心级别的性能可以在移动、自给自足的封装中实现,且能在全球任何地方有效运行。
无论是应用于采用 DUG 先进数据处理的地震成像、AI 推理,还是科学研究,这种集成解决方案都提供了卓越的能力,改变了各组织在偏远环境中处理数据的方式。
随着边缘 AI 和 HPC 工作负载在各行业的重要性不断提高,DUG Nomad 等解决方案将变得愈发关键,因为这些解决方案能够帮助组织最大化数据价值,同时将传统集中式处理方法的成本和复杂性降至最低。这种集成解决方案所展现出的可靠性、性能和部署灵活性,为边缘计算基础设施树立了新的标准,这将影响未来技术和应用的发展。
本文中的任何内容均无意作出任何明示或默示的担保,包括但不限于关于适销性、适合特定目的及不侵权的默示保证,或在履行合同、交易过程或贸易惯例中产生的任何担保。
本文档中描述的产品可能存在被称为“缺陷”的设计缺陷或错误,这些问题可能导致产品偏离已发布的技术规范。当前已确认的缺陷可应要求提供。
Solidigm 不对第三方数据承担任何控制或审计的责任。您应参考其他信息来源以评估准确性。
请在下单之前联系您的 Solidigm 代表或经销商以获取最新规格。
SOLIDIGM 及 Solidigm“S”徽标均为 SK hynix NAND Product Solutions Corp.(以 Solidigm 名义开展业务)的商标,已在美国、中华人民共和国、日本、新加坡、欧盟、英国、墨西哥及其他国家/地区注册。