Quobyte发布MLPerf存储基准测试成绩挑战存储系统极限

Quobyte首次公布其在MLPerf存储基准测试中的表现，在关键的3D-Unet基准测试中取得显著优势。该测试专门评估存储系统在模型训练时的数据供应能力，对确保昂贵GPU充分利用至关重要。Quobyte使用8节点集群配置，成功支持每客户端6个GPU达到90%效率，并声称是该测试中最快最高效的文件系统，在支持GPU数量、成本控制和能耗方面均表现出色。

Quobyte公司首次公开发布了其在同名并行文件系统上运行MLPerf存储基准测试的结果，声称在关键的3D-Unet基准测试中取得了显著优势。

该基准测试是ML Commons去年首次推出的三项测试之一，用于衡量存储系统在模型训练期间的数据供应能力。

毫无疑问，这是确保昂贵且耗电的GPU得到充分利用的关键因素——目前GPU的利用率很少接近理想水平。

Quobyte表示："在三个基准测试中，3D U-Net特别有趣，因为它最依赖于存储性能。"

正如Quobyte联合创始人兼首席执行官Bjorn Kolbeck所说，这是真正"考验和折磨存储系统"的测试。

Quobyte指出，要通过测试，"MLPerf存储要求利用率达到90%或以上。利用率直接转化为特定的吞吐量，因为它决定了工作负载发出IO请求的速度。"

"目标是以最少的存储资源集合（因为它们需要金钱、占地面积和能源）支持每个客户端8个GPU在高利用率（90%以上）下运行，"该公司补充道。

对于3D U-Net，"每个全速运行的模拟H100 GPU需要大约2.8 GBps的吞吐量。使用DGX的200G网络，这意味着最多只能保持7个GPU在90%以上的利用率。"

测试配置如何？

Quobyte的设置是一个八节点集群，通过2x100G RoCE网络连接，包含四台客户端机器（Supermicro）和四台服务器机器（Supermicro），每台配备4个PCI 4.0 NVM。

对于MLPerf存储v1.0.1版本，使用H100，Quobyte表示能够支持"每个客户端（每个DGX）6个GPU在90%效率下运行"。该公司的目标是通过配备更快CPU的客户端机器，将这一数字提升到7个GPU，并实现更高的利用率。

"在服务器端，我们通过四台通过200G RoCE连接的标准服务器提供这种性能。这种设置提供高可用性，并可以与更多DGX客户端线性扩展。"

Quobyte声称这使其成为MLPerf 3D-Unet测试中最快、最高效的文件系统，支持每台客户端机器最多的GPU数量。同样重要的是，该公司还声称实现了每性能单位最低的成本和能耗。

联合创始人兼首席技术官Felix Hupfeld说："我们的不同之处在于在另一端需要多少资源来提供这种性能。饱和GPU所需的资源会转化为更多功耗、更多占地面积，当然还有更多成本。"

虽然英伟达在AI世界中备受关注，但Kolbeck表示存储至关重要，而基于NFS的系统从未为扩展而设计。

他继续说道，选择错误的系统，"你就无法获得GPU所需的效率，然后你就被这个解决方案困住了。"

"你在存储系统上花费数百万美元，却无法提供GPU所需的性能，基本上毁掉了GPU投资。"

MLPerf存储基准测试的新版本即将发布。虽然Quobyte没有参与去年的"官方"提交轮次，但该公司表示这次完全打算参与。

来源：BLOCKS & FILES

0赞

好文章，需要你的鼓励

Quobyte发布MLPerf存储基准测试成绩挑战存储系统极限

来源：BLOCKS & FILES

2025

06/16

14:31

分享

点赞

联想集团混合式AI实践获权威肯定，CES期间获评“全球科技引领企业”

CES上杨元庆首谈AGI，碾压人类的叙事不会让AI更聪明

CES 2026 | 重大更新：NVIDIA DGX Spark开启“云边端”模式

Gmail新增Gemini驱动AI功能，智能优先级和摘要来袭

研究发现商业AI模型可完整还原《哈利·波特》原著内容

Razer在2026年CES展会推出全息AI伴侣项目

CES 2026：英伟达新架构亮相，AMD发布新芯片，Razer推出AI奇异产品

通过舞蹈认识LimX Dynamics的人形机器人Oli

谷歌为Gmail搜索引入AI概览功能并推出实验性AI智能收件箱

DuRoBo Krono：搭载AI助手的智能手机尺寸电子阅读器

OpenAI推出ChatGPT Health医疗问答功能

Anthropic寻求3500亿美元估值融资100亿美元

AI搜索改写在线可见性规则 传统搜索时代或将终结

谷歌云与新加坡数字产业合作推出人工智能卓越中心计划

爱立信与超微推进边缘AI系统企业连接性

牛津医学研究揭示聊天机器人测试中的关键缺失环节

AI系统规模化前应内置审计追踪的必要性

超越GPT架构：谷歌扩散模型或将重塑大语言模型部署方式

多模态AI：强大飞跃背后的复杂权衡考量

AMD超越AI能效目标并树立行业新标准

DeepSeek重新定义AI发展路径：低成本高效率模式挑战传统范式

前沿模型的工作方式：与AI智能对话的新时代

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

CES 2026

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

AI搜索改写在线可见性规则传统搜索时代或将终结