分析:DDN 在 Nvidia GTC 2025 大会上发布了其高速对象存储设备 Inferno 和混合文件+对象技术 xFusionAI。让我们来分析这两项技术的特点。
从 AI 训练和推理的角度来看,DDN 拥有两种存储技术。其最初面向 HPC 的 EXAScaler 产品线提供基于 Lustre 的并行文件系统,该系统运行在配备 NVMe SSD 的横向扩展存储节点上,客户端软件在 GPU 服务器节点上执行。较新的 Infinia 技术提供了一个基础的键值存储,在其上层叠加了数据访问协议,首先是 S3 对象协议。文件、块等其他协议将随时间逐步添加。
2 月发布的 Infinia v2.0 旨在消除 AI 瓶颈、加速工作流程并支持复杂模型列表的扩展。DDN 表示,它提供实时数据服务、多租户、智能自动化,并具有"强大的 AI 原生架构"。
但它不支持文件访问,而迄今为止的大多数 AI 开发工作都使用快速文件访问,同时使用较慢的对象协议来访问海量非结构化数据存储。简单来说,在当今的 AI 领域,文件代表过去,但仍参与现在并与日益增长的对象访问共存,而对象访问在未来将变得越来越重要。在可预见的未来,AI 训练和推理领域将是一个混合文件+对象的世界。
Inferno 产品在 Infinia 存储的基础上增加了 Nvidia 的 Spectrum-X 交换机,具备 RoCE 自适应路由功能。DDN 表示,测试显示 Inferno 的性能比基于 AWS S3 的推理堆栈高出 12 倍,具有亚毫秒级延迟和 99% 的 GPU 利用率。DDN 指出,Inferno "是一款高密度、低功耗的 1RU 设备,配备 2 个或 4 个 BlueField"。这些是 Nvidia 的基于 Arm 的智能网卡,可与 Nvidia GPU 服务器中的 BlueField 连接。
Inferno 使用"高性能 NVMe 驱动器实现超低延迟...支持无缝扩展",并且"针对 AI 模型训练和推理进行了优化"。它"与 DDN 的 AI 和 HPC 生态系统完全优化,确保部署流程简化"。
目前没有公开的 Inferno 配置或可用性信息。如果这样的设备使用 122 TB QLC SSD,那么我们可能会看到一个具有 1.2 PB 容量的十槽机箱。一个包含 30 个此类设备的机架将具有 36 PB 容量,采用基于 NVMe/GPUDirect for Objects 的网络结构,由 BlueField-3 通过 Spectrum-X 网络与连接到 GPU 服务器的 BlueField-3 通信。
DDN 将 xFusionAI 技术描述为不同的解决方案,称其"被设计为集成的 AI 存储和数据管理解决方案,在高速并行文件存储和经济高效的对象存储之间实现 AI 工作流的平衡...存储是一个单一池,在 EXAScaler 和 Infinia 之间进行逻辑分区,而不是两个完全独立的系统。xFusionAI 可以部署在统一的硬件基础设施上,EXAScaler 和 Infinia 软件组件在同一系统内运行。"
它"具有单一用户界面,可提供对 EXAScaler 和 Infinia 环境的可视性和控制,确保管理流程简化。"
供应商表示,Infinia 不仅仅是后端对象存储,它还作为智能数据管理层来补充 EXAScaler 的高速文件性能。数据可以通过自动化策略或手动分层在 EXAScaler 和 Infinia 之间移动,使用户能够优化存储成本和性能。
实际上,我们看到高速文件存储 (EXAScaler) 被添加到 Infinia 中,这可能是在 Infinia 的原生文件系统支持到来之前的临时解决方案。这意味着 xFusionAI 控制器将比 Inferno (仅 Infinia 对象) 控制器更强大,因为它们必须管理文件和对象环境并在它们之间"移动"数据。我们在"移动"上加引号是因为数据可能实际上并不会物理移动;它可能以某种方式重新映射,使其从 EXAScaler 分区传输到 Infinia 分区,反之亦然。当然,如果 Infinia 分区使用较慢的 QLC 驱动器,而 EXAScaler 分区使用较快的 TLC 驱动器,那么数据将会物理移动。
随着细节的逐步披露,了解这个混合系统将会很有趣。一个重要见解是,xFusionAI 为 DDN 提供了一个组合的文件+对象 AI 训练和推理存储系统,可以与 VAST Data 的混合文件+对象存储竞争,后者还具有块访问功能,这在目前的 AI 世界中不太重要。DDN 表示,"产品即将推出。价格详情可根据要求提供,具体取决于配置、容量和部署规模。"
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。