MinIO正在将其AIStor对象软件与超微Intel Xeon 6服务器和Solidigm固态硬盘相结合,打造1 EiB(1.13 EB)机架级本地构建模块,将AI数据存储扩展至泽字节级别。
这是对MinIO在2024年8月推出的DataPOD对象存储参考架构的扩展,该架构是一个可扩展的100 PiB(112.6 PB)模块化构建块,旨在向英伟达GPU服务器快速提供数据。AIStor在一年前发布,通过S3 API、PromptObject、S3 over RDMA支持、AIHub私有Hugging Face存储库以及带有Kubernetes操作器的更新全局控制台,扩展了MinIO的企业级对象存储软件,为AI训练和推理提供快速且大容量的对象存储。ExaPOD参考架构进一步支持EB级容量。
联合创始人兼联席首席执行官AB Periasamy表示:"AI不仅仅是采用最新模型或GPU,而是要重新构建数据在大规模环境下的存储、传输和访问方式。AI时代的赢家将由其以超大规模性能和超级云计算经济效益高效交付数据的能力来定义。ExaPOD使这成为可能,为企业提供简单的模块化架构,让他们能够按自己的条件构建AI基础设施,拥有完全控制权且不妥协。"
MinIO表示,AI训练和推理GPU可能因数据无法足够快速到达GPU而处于空闲状态。ExaPOD将通过"在EB级规模下减少和稳定延迟,确保一致的高吞吐量数据路径,让AI工作负载持续获得数据并保持运行"来保持GPU忙碌状态。
与美国拥有的公有云对象存储相比,它提供可预测的总拥有成本(TCO)、无出口费用或云锁定,以及主权部署能力。建议的TCO为每月每可用TiB 4.55至4.60美元,但具体情况因人而异。
一个ExaPOD 48U机架拥有36 PiB(40.5 PB)全闪存可用容量,每个可用容量PiB使用高达900瓦功率,意味着每个ExaPOD机架功耗32,400瓦。它配备400千兆以太网链路,使用超微SYS-212-TN 2RU服务器,具有24个NVMe驱动器插槽和Xeon 6781P(80核心,136个PCIe Gen 5通道)CPU。固态硬盘为122.88 TB PCIe Gen 5接口QLC闪存NVMe驱动器,在服务器的24个固态硬盘间实现完全并行化,机架可选配液体冷却。
配置32个机架、每机架640台服务器和122.88 TB固态硬盘时,在1 EiB容量下可实现19.2 TBps聚合吞吐量。也支持较低容量的固态硬盘。据MinIO称,它实现了线性性能扩展和一致的首字节时间(TTTB)。据了解,ExaPOD原生支持生成式AI、向量数据库和边缘计算,并支持AI驱动的可观测性。
在MinIO看来,ExaPOD为本地存储世界带来了超大规模单元经济效益。
MinIO将在2025年11月16-21日于圣路易斯举办的超级计算大会上的6513号展台展示ExaPOD。相关ExaPOD背景信息可查看博客和白皮书。
附注
1 EiB(艾字节)包含1,048,576 TiB(太字节),这意味着1 EiB ExaPOD的TCO将为每月4,771,020.80至4,823,449.30美元。
Q&A
Q1:MinIO ExaPOD是什么产品?
A:ExaPOD是MinIO推出的EB级对象存储解决方案,将AIStor软件与超微Intel Xeon 6服务器和Solidigm固态硬盘结合,打造1 EiB机架级存储模块,专为AI数据存储设计,可扩展至泽字节级别。
Q2:ExaPOD如何解决AI GPU空闲问题?
A:AI训练和推理GPU常因数据无法足够快速到达而处于空闲状态。ExaPOD通过在EB级规模下减少和稳定延迟,确保一致的高吞吐量数据路径,让AI工作负载持续获得数据并保持运行状态。
Q3:ExaPOD的性能规格如何?
A:单个ExaPOD 48U机架拥有36 PiB全闪存可用容量,功耗32,400瓦,配备400千兆以太网。配置32个机架时,在1 EiB容量下可实现19.2 TBps聚合吞吐量,实现线性性能扩展。
好文章,需要你的鼓励
Anthropic发布SCONE-bench智能合约漏洞利用基准测试,评估AI代理发现和利用区块链智能合约缺陷的能力。研究显示Claude Opus 4.5等模型可从漏洞中获得460万美元收益。测试2849个合约仅需3476美元成本,发现两个零日漏洞并创造3694美元利润。研究表明AI代理利用安全漏洞的能力快速提升,每1.3个月翻倍增长,强调需要主动采用AI防御技术应对AI攻击威胁。
NVIDIA联合多所高校开发的SpaceTools系统通过双重交互强化学习方法,让AI学会协调使用多种视觉工具进行复杂空间推理。该系统在空间理解基准测试中达到最先进性能,并在真实机器人操作中实现86%成功率,代表了AI从单一功能向工具协调专家的重要转变,为未来更智能实用的AI助手奠定基础。
Spotify年度总结功能回归,在去年AI播客功能遭遇批评后,今年重新专注于用户数据深度分析。新版本引入近十项新功能,包括首个实时多人互动体验"Wrapped Party",最多可邀请9位好友比较听歌数据。此外还新增热门歌曲播放次数显示、互动歌曲测验、听歌年龄分析和听歌俱乐部等功能,让年度总结更具互动性和个性化体验。
这项研究解决了现代智能机器人面临的"行动不稳定"问题,开发出名为TACO的决策优化系统。该系统让机器人在执行任务前生成多个候选方案,然后通过伪计数估计器选择最可靠的行动,就像为机器人配备智能顾问。实验显示,真实环境中机器人成功率平均提升16%,且系统可即插即用无需重新训练,为机器人智能化发展提供了新思路。