Quobyte发布MLPerf存储基准测试成绩挑战存储系统极限

Quobyte首次公布其在MLPerf存储基准测试中的表现，在关键的3D-Unet基准测试中取得显著优势。该测试专门评估存储系统在模型训练时的数据供应能力，对确保昂贵GPU充分利用至关重要。Quobyte使用8节点集群配置，成功支持每客户端6个GPU达到90%效率，并声称是该测试中最快最高效的文件系统，在支持GPU数量、成本控制和能耗方面均表现出色。

Quobyte公司首次公开发布了其在同名并行文件系统上运行MLPerf存储基准测试的结果，声称在关键的3D-Unet基准测试中取得了显著优势。

该基准测试是ML Commons去年首次推出的三项测试之一，用于衡量存储系统在模型训练期间的数据供应能力。

毫无疑问，这是确保昂贵且耗电的GPU得到充分利用的关键因素——目前GPU的利用率很少接近理想水平。

Quobyte表示："在三个基准测试中，3D U-Net特别有趣，因为它最依赖于存储性能。"

正如Quobyte联合创始人兼首席执行官Bjorn Kolbeck所说，这是真正"考验和折磨存储系统"的测试。

Quobyte指出，要通过测试，"MLPerf存储要求利用率达到90%或以上。利用率直接转化为特定的吞吐量，因为它决定了工作负载发出IO请求的速度。"

"目标是以最少的存储资源集合（因为它们需要金钱、占地面积和能源）支持每个客户端8个GPU在高利用率（90%以上）下运行，"该公司补充道。

对于3D U-Net，"每个全速运行的模拟H100 GPU需要大约2.8 GBps的吞吐量。使用DGX的200G网络，这意味着最多只能保持7个GPU在90%以上的利用率。"

测试配置如何？

Quobyte的设置是一个八节点集群，通过2x100G RoCE网络连接，包含四台客户端机器（Supermicro）和四台服务器机器（Supermicro），每台配备4个PCI 4.0 NVM。

对于MLPerf存储v1.0.1版本，使用H100，Quobyte表示能够支持"每个客户端（每个DGX）6个GPU在90%效率下运行"。该公司的目标是通过配备更快CPU的客户端机器，将这一数字提升到7个GPU，并实现更高的利用率。

"在服务器端，我们通过四台通过200G RoCE连接的标准服务器提供这种性能。这种设置提供高可用性，并可以与更多DGX客户端线性扩展。"

Quobyte声称这使其成为MLPerf 3D-Unet测试中最快、最高效的文件系统，支持每台客户端机器最多的GPU数量。同样重要的是，该公司还声称实现了每性能单位最低的成本和能耗。

联合创始人兼首席技术官Felix Hupfeld说："我们的不同之处在于在另一端需要多少资源来提供这种性能。饱和GPU所需的资源会转化为更多功耗、更多占地面积，当然还有更多成本。"

虽然英伟达在AI世界中备受关注，但Kolbeck表示存储至关重要，而基于NFS的系统从未为扩展而设计。

他继续说道，选择错误的系统，"你就无法获得GPU所需的效率，然后你就被这个解决方案困住了。"

"你在存储系统上花费数百万美元，却无法提供GPU所需的性能，基本上毁掉了GPU投资。"

MLPerf存储基准测试的新版本即将发布。虽然Quobyte没有参与去年的"官方"提交轮次，但该公司表示这次完全打算参与。

来源：BLOCKS & FILES

0赞

好文章，需要你的鼓励

Quobyte发布MLPerf存储基准测试成绩挑战存储系统极限

来源：BLOCKS & FILES

2025

06/16

14:31

分享

点赞

Cloudera扩展AI生态系统，助力企业向AI原生转型

Cloudera凭借安全、可控且高性能的统一数据平台，加速AI与数据分析

Cloudera调查发现：96%的企业已将AI融入核心业务，AI已从竞争优势转为必备技术

Cloudera携手Dell ObjectScale，为企业提供新一代私有AI平台

云栖大会上，感受AI汽车的"乐与路"

CISA要求联邦机构修补思科防火墙设备零日漏洞

独立应用推荐：TimeWave帮你创建流动计时器，设计简洁实用

亚马逊秋季硬件发布会预期：智能家居新品即将亮相

推动AI繁荣的数十亿美元基础设施交易内幕

AI改造传统服务业或比风投想象的更困难

加拿大推出首个主权AI工厂，由TELUS主导建设

Mac用户终于开始重视恶意软件威胁

AI搜索改写在线可见性规则 传统搜索时代或将终结

谷歌云与新加坡数字产业合作推出人工智能卓越中心计划

爱立信与超微推进边缘AI系统企业连接性

牛津医学研究揭示聊天机器人测试中的关键缺失环节

AI系统规模化前应内置审计追踪的必要性

超越GPT架构：谷歌扩散模型或将重塑大语言模型部署方式

多模态AI：强大飞跃背后的复杂权衡考量

AMD超越AI能效目标并树立行业新标准

DeepSeek重新定义AI发展路径：低成本高效率模式挑战传统范式

前沿模型的工作方式：与AI智能对话的新时代

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

用AI，在数字身份验证风暴中心重构信任坐标

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

AI搜索改写在线可见性规则传统搜索时代或将终结