Solidigm 成立AI中央实验室,配备高性能、大密度存储测试集群

企业数据存储领域领导者 Solidigm正式揭幕其 AI 中央实验室。该实验室配备了专为多种AI工作负载量身打造的高性能、高密度的存储测试集群。

企业数据存储领域领导者 Solidigm正式揭幕其 AI 中央实验室。该实验室配备了专为多种AI工作负载量身打造的高性能、高密度的存储测试集群。

这座先进的 AI 中央实验室坐落于美国兰乔科尔多瓦的 FarmGPU 设施内,紧邻 Solidigm 总部。在这里,Solidigm 能够利用NVIDIA B200 和 H200 图形处理器,运行并研究真实的 AI 工作负载。这不仅为我们理解前沿存储技术如何最大限度地提升集群效率,提供了独到的见解,更让 Solidigm 在 AI 生态系统中的重要合作伙伴,有机会在先进的硬件平台上充分开展实验。

Solidigm AI 生态系统与合作伙伴关系高级总监 Avi Shetty 强调:“Solidigm AI 中央实验室将当前强大的 GPU 与领先的存储基础设施融合,为客户和开发者社区开启了前所未有的测试与联合创新篇章。Solidigm 希望这些能力可以惠及更多用户,同时证明了存储与 GPU 紧密集成的重要性与价值。”

该实验室在建设之初便秉持通用参考架构理念,客户可以在一个与全球大型数据中心保持一致标准的环境中,利用 Solidigm SSD测试其解决方案。此外,实验室还将大力推动存储研究,超越传统的组件级测试范畴,更深层次地理解服务器、机架乃至集群层面的真实应用场景。

Shetty 进一步指出:“如今,仅仅进行存储测试已远远不够。在AI 中央实验室,我们能够运行真实场景的AI 工作负载,并借助尖端遥测技术来优化系统性能和效率,以便更深刻地理解新兴工作负载对存储的实际需求。”

AI中央实验室配备了最新的高性能计算硬件,包括:

  • 高性能存储测试集群:采用超高速Solidigm™ D7-PS1010 SSD,在MLPerf存储(AI模型训练)测试中达到了创纪录的每节点116 GB/s吞吐量,可灵活扩展至多个节点。
  • 高密度存储测试集群:配备了192块Solidigm D5-P5336 SSD,每块容量高达122TB,仅占用16U机架空间即可带来6PB的总存储容量。
  • 其他配置:实验室还配备NVIDIA B200和H200 GPU、800 Gbps以太网络以及领先供应商的存储服务器。Solidigm也在不断扩展和探索新技术。

实验室可供测试的工作负载包括:

  • AI特定及新兴工作负载,例如真实场景下的GPU密集型的AI模型训练和推理,以及KV缓存卸载和VectorDB调优等创新方法。
  • 实验室能够对不同配置进行功耗基准测试,从而开发出能够高效利用能源的架构。
  • 实验室可深入研究如何快速向价格高昂的GPU加速器传输数据,使其尽可能保持高负载状态,最大限度释放其算力。
  • AI 中央实验室所产生的数据,有助于将SSD的硬件规格,转化为系统层级、与行业应用紧密相关的 AI 效率指标,例如每美元可处理的token和每瓦特可处理的token。

目前,该实验室已与多家机构建立了合作。其中之一是,Solidigm 与 Metrum AI 的专家们携手攻关,成功开发出一种创新技术,能够将 AI 数据从内存卸载至SSD,从而在使用 RAG(检索增强生成)进行推理时,将DRAM的使用量降低高达 57%。

来源:至顶网存储频道

0赞

好文章,需要你的鼓励

2025

10/09

16:04

分享

点赞

邮件订阅