MinIO推出EB级ExaPOD存储方案保持AI GPU高效运行

MinIO将其AIStor对象软件与超微Intel Xeon 6服务器和Solidigm固态硬盘相结合,打造1 EiB容量的机架级本地存储模块,将AI数据存储扩展至ZB级别。该方案基于DataPOD对象存储参考架构,单机架提供36 PiB全闪存可用容量,通过减少和稳定EB级延迟,确保AI工作负载持续高效运行,避免GPU因数据传输不足而闲置。

MinIO正在将其AIStor对象软件与超微Intel Xeon 6服务器和Solidigm固态硬盘相结合,打造1 EiB(1.13 EB)机架级本地构建模块,将AI数据存储扩展至泽字节级别。

这是对MinIO在2024年8月推出的DataPOD对象存储参考架构的扩展,该架构是一个可扩展的100 PiB(112.6 PB)模块化构建块,旨在向英伟达GPU服务器快速提供数据。AIStor在一年前发布,通过S3 API、PromptObject、S3 over RDMA支持、AIHub私有Hugging Face存储库以及带有Kubernetes操作器的更新全局控制台,扩展了MinIO的企业级对象存储软件,为AI训练和推理提供快速且大容量的对象存储。ExaPOD参考架构进一步支持EB级容量。

联合创始人兼联席首席执行官AB Periasamy表示:"AI不仅仅是采用最新模型或GPU,而是要重新构建数据在大规模环境下的存储、传输和访问方式。AI时代的赢家将由其以超大规模性能和超级云计算经济效益高效交付数据的能力来定义。ExaPOD使这成为可能,为企业提供简单的模块化架构,让他们能够按自己的条件构建AI基础设施,拥有完全控制权且不妥协。"

MinIO表示,AI训练和推理GPU可能因数据无法足够快速到达GPU而处于空闲状态。ExaPOD将通过"在EB级规模下减少和稳定延迟,确保一致的高吞吐量数据路径,让AI工作负载持续获得数据并保持运行"来保持GPU忙碌状态。

与美国拥有的公有云对象存储相比,它提供可预测的总拥有成本(TCO)、无出口费用或云锁定,以及主权部署能力。建议的TCO为每月每可用TiB 4.55至4.60美元,但具体情况因人而异。

一个ExaPOD 48U机架拥有36 PiB(40.5 PB)全闪存可用容量,每个可用容量PiB使用高达900瓦功率,意味着每个ExaPOD机架功耗32,400瓦。它配备400千兆以太网链路,使用超微SYS-212-TN 2RU服务器,具有24个NVMe驱动器插槽和Xeon 6781P(80核心,136个PCIe Gen 5通道)CPU。固态硬盘为122.88 TB PCIe Gen 5接口QLC闪存NVMe驱动器,在服务器的24个固态硬盘间实现完全并行化,机架可选配液体冷却。

配置32个机架、每机架640台服务器和122.88 TB固态硬盘时,在1 EiB容量下可实现19.2 TBps聚合吞吐量。也支持较低容量的固态硬盘。据MinIO称,它实现了线性性能扩展和一致的首字节时间(TTTB)。据了解,ExaPOD原生支持生成式AI、向量数据库和边缘计算,并支持AI驱动的可观测性。

在MinIO看来,ExaPOD为本地存储世界带来了超大规模单元经济效益。

MinIO将在2025年11月16-21日于圣路易斯举办的超级计算大会上的6513号展台展示ExaPOD。相关ExaPOD背景信息可查看博客和白皮书。

附注

1 EiB(艾字节)包含1,048,576 TiB(太字节),这意味着1 EiB ExaPOD的TCO将为每月4,771,020.80至4,823,449.30美元。

Q&A

Q1:MinIO ExaPOD是什么产品?

A:ExaPOD是MinIO推出的EB级对象存储解决方案,将AIStor软件与超微Intel Xeon 6服务器和Solidigm固态硬盘结合,打造1 EiB机架级存储模块,专为AI数据存储设计,可扩展至泽字节级别。

Q2:ExaPOD如何解决AI GPU空闲问题?

A:AI训练和推理GPU常因数据无法足够快速到达而处于空闲状态。ExaPOD通过在EB级规模下减少和稳定延迟,确保一致的高吞吐量数据路径,让AI工作负载持续获得数据并保持运行状态。

Q3:ExaPOD的性能规格如何?

A:单个ExaPOD 48U机架拥有36 PiB全闪存可用容量,功耗32,400瓦,配备400千兆以太网。配置32个机架时,在1 EiB容量下可实现19.2 TBps聚合吞吐量,实现线性性能扩展。

来源:BLOCKS & FILES

0赞

好文章,需要你的鼓励

2025

11/17

08:35

分享

点赞

邮件订阅