MinIO正在将其AIStor对象软件与超微Intel Xeon 6服务器和Solidigm固态硬盘相结合,打造1 EiB(1.13 EB)机架级本地构建模块,将AI数据存储扩展至泽字节级别。
这是对MinIO在2024年8月推出的DataPOD对象存储参考架构的扩展,该架构是一个可扩展的100 PiB(112.6 PB)模块化构建块,旨在向英伟达GPU服务器快速提供数据。AIStor在一年前发布,通过S3 API、PromptObject、S3 over RDMA支持、AIHub私有Hugging Face存储库以及带有Kubernetes操作器的更新全局控制台,扩展了MinIO的企业级对象存储软件,为AI训练和推理提供快速且大容量的对象存储。ExaPOD参考架构进一步支持EB级容量。
联合创始人兼联席首席执行官AB Periasamy表示:"AI不仅仅是采用最新模型或GPU,而是要重新构建数据在大规模环境下的存储、传输和访问方式。AI时代的赢家将由其以超大规模性能和超级云计算经济效益高效交付数据的能力来定义。ExaPOD使这成为可能,为企业提供简单的模块化架构,让他们能够按自己的条件构建AI基础设施,拥有完全控制权且不妥协。"
MinIO表示,AI训练和推理GPU可能因数据无法足够快速到达GPU而处于空闲状态。ExaPOD将通过"在EB级规模下减少和稳定延迟,确保一致的高吞吐量数据路径,让AI工作负载持续获得数据并保持运行"来保持GPU忙碌状态。
与美国拥有的公有云对象存储相比,它提供可预测的总拥有成本(TCO)、无出口费用或云锁定,以及主权部署能力。建议的TCO为每月每可用TiB 4.55至4.60美元,但具体情况因人而异。
一个ExaPOD 48U机架拥有36 PiB(40.5 PB)全闪存可用容量,每个可用容量PiB使用高达900瓦功率,意味着每个ExaPOD机架功耗32,400瓦。它配备400千兆以太网链路,使用超微SYS-212-TN 2RU服务器,具有24个NVMe驱动器插槽和Xeon 6781P(80核心,136个PCIe Gen 5通道)CPU。固态硬盘为122.88 TB PCIe Gen 5接口QLC闪存NVMe驱动器,在服务器的24个固态硬盘间实现完全并行化,机架可选配液体冷却。
配置32个机架、每机架640台服务器和122.88 TB固态硬盘时,在1 EiB容量下可实现19.2 TBps聚合吞吐量。也支持较低容量的固态硬盘。据MinIO称,它实现了线性性能扩展和一致的首字节时间(TTTB)。据了解,ExaPOD原生支持生成式AI、向量数据库和边缘计算,并支持AI驱动的可观测性。
在MinIO看来,ExaPOD为本地存储世界带来了超大规模单元经济效益。
MinIO将在2025年11月16-21日于圣路易斯举办的超级计算大会上的6513号展台展示ExaPOD。相关ExaPOD背景信息可查看博客和白皮书。
附注
1 EiB(艾字节)包含1,048,576 TiB(太字节),这意味着1 EiB ExaPOD的TCO将为每月4,771,020.80至4,823,449.30美元。
Q&A
Q1:MinIO ExaPOD是什么产品?
A:ExaPOD是MinIO推出的EB级对象存储解决方案,将AIStor软件与超微Intel Xeon 6服务器和Solidigm固态硬盘结合,打造1 EiB机架级存储模块,专为AI数据存储设计,可扩展至泽字节级别。
Q2:ExaPOD如何解决AI GPU空闲问题?
A:AI训练和推理GPU常因数据无法足够快速到达而处于空闲状态。ExaPOD通过在EB级规模下减少和稳定延迟,确保一致的高吞吐量数据路径,让AI工作负载持续获得数据并保持运行状态。
Q3:ExaPOD的性能规格如何?
A:单个ExaPOD 48U机架拥有36 PiB全闪存可用容量,功耗32,400瓦,配备400千兆以太网。配置32个机架时,在1 EiB容量下可实现19.2 TBps聚合吞吐量,实现线性性能扩展。
好文章,需要你的鼓励
AI颠覆预计将在2026年持续,推动企业适应不断演进的技术并扩大规模。国际奥委会、Moderna和Sportradar的领导者在纽约路透社峰会上分享了他们的AI策略。讨论焦点包括自建AI与购买第三方资源的选择,AI在内部流程优化和外部产品开发中的应用,以及小型模型在日常应用中的潜力。专家建议,企业应将AI建设融入企业文化,以创新而非成本节约为驱动力。
字节跳动等机构联合发布GAR技术,让AI能同时理解图像的全局和局部信息,实现对多个区域间复杂关系的准确分析。该技术通过RoI对齐特征重放方法,在保持全局视野的同时提取精确细节,在多项测试中表现出色,甚至在某些指标上超越了体积更大的模型,为AI视觉理解能力带来重要突破。
Spotify在新西兰测试推出AI提示播放列表功能,用户可通过文字描述需求让AI根据指令和听歌历史生成个性化播放列表。该功能允许用户设置定期刷新,相当于创建可控制算法的每周发现播放列表。这是Spotify赋予用户更多控制权努力的一部分,此前其AI DJ功能也增加了语音提示选项,反映了各平台让用户更好控制算法推荐的趋势。
Inclusion AI团队推出首个开源万亿参数思维模型Ring-1T,通过IcePop、C3PO++和ASystem三项核心技术突破,解决了超大规模强化学习训练的稳定性和效率难题。该模型在AIME-2025获得93.4分,IMO-2025达到银牌水平,CodeForces获得2088分,展现出卓越的数学推理和编程能力,为AI推理能力发展树立了新的里程碑。