高带宽闪存技术承诺提供超大容量,但面临极其复杂的工程挑战。该技术将多层NAND芯片堆叠,每层由数百个3D NAND单元层组成,可创造前所未有的存储容量。相比昂贵的HBM内存,HBF使用更便宜但速度较慢的闪存为GPU提供更多存储空间。技术复杂性体现在互连布线的困难,12层HBF堆叠将包含2866个存储层。由于需要英伟达等GPU厂商深度参与和行业标准制定,预计HBF距离商用还需两年以上时间。
并行文件系统在高性能计算中至关重要,为数千个计算节点提供高聚合I/O带宽和低延迟访问。系统分为分条型和非分条型:非分条型在单节点存储文件,元数据负担较轻;分条型将文件分片存储到不同节点,需维护分条映射信息。Dell Project Lightning项目通过专有客户端驱动实现极致并行性能。
Hammerspace在IO500基准测试中取得突破,其标准Linux加NFS系统软件实现了HPC级性能,无需专有并行文件系统的复杂性。在SC25的10节点生产环境测试中排名第18位,这是NFS系统有史以来最快的结果。该公司使用标准Linux、上游NFSv4.2客户端和商用NVMe闪存实现了总分85.23的成绩,证明HPC级性能不再需要专有客户端或特殊文件系统。
Wasabi公司推出Fire高性能存储服务,专门针对AI工作负载设计。该服务采用NVMe SSD技术,提供个位数毫秒响应时间,比常规S3存储快5倍。定价为每TB每月19.99美元,无出口费用,成本仅为AWS S3 Express的六分之一。Fire服务支持AI训练、实时推理和高频数据记录等计算密集型应用,并在硅谷新开设存储区域为AI初创企业提供服务。
NAND产业正面临三年芯片产出短缺,新晶圆厂建设需要数年时间。Solidigm在伦敦技术会议上表示,过去三个月SSD需求急剧增长,需求被严重低估。AI推理工作负载增长导致数据变得更热,需要存储在SSD而非硬盘上以提高GPU利用率。新洁净室建设成本高达180亿美元,加上HBM供应短缺,制造商更倾向于投资更profitable的HBM产能。未来三年内NAND洁净室产能不会大幅增加。
日立万达发布全新VSP One Block高端存储系列,将原有VSP One 5000混合存储升级为全NVMe闪存系统。新产品专为关键任务和AI工作负载设计,具备FIPS 140-3 Level 2认证保护、八个九的可用性和近零数据丢失。系统支持最多12个控制器和288个60TB SSD,提供统一的块、文件、对象和大型机工作负载整合。产品将于2026年初全球发售。
DDN在SC25大会上发布了全新的CORE AI和HPC统一数据平面,整合了EXAScaler Lustre文件存储和Infinia对象存储系统,并推出A1400X3i和A12200新硬件。该公司声称其存储系统支持超过11000个客户的100万个GPU。CORE作为软件抽象层,统一管理本地部署和公有云实例,提供一致的AI数据性能,支持从模拟到训练、推理和检索增强生成的整个AI生命周期。
德克萨斯大学奥斯汀分校先进计算中心正在为其地平线AI和仿真超级计算机构建存储系统。该系统采用VAST Data在线存储、戴尔缓存归档前端、Versity软件和Spectra Logic离线磁带存储。地平线超算将成为全球最大的专用于开放科学研究的学术超级计算机,性能达到400千万亿次浮点运算,配备400PB全闪存存储和1EB级磁带归档系统。
戴尔在超级计算大会2025上宣布闪电项目已成功将PowerScale并行化,显著提升文件读写性能。通过pNFS和Flex Files布局支持,PowerScale实现了元数据服务器与客户端间的双向通信,在集群多个节点间实现更好的并行数据分布。新增NIXL库KV缓存卸载集成,支持软件订阅许可模式。ObjectScale新增AI优化搜索功能,包括S3表格和向量搜索API。
MinIO将其AIStor对象软件与超微Intel Xeon 6服务器和Solidigm固态硬盘相结合,打造1 EiB容量的机架级本地存储模块,将AI数据存储扩展至ZB级别。该方案基于DataPOD对象存储参考架构,单机架提供36 PiB全闪存可用容量,通过减少和稳定EB级延迟,确保AI工作负载持续高效运行,避免GPU因数据传输不足而闲置。
Quantum为其ActiveScale磁带后端推出范围恢复功能,显著提升部分对象检索速度。客户现在只需恢复大型对象中所需的特定字节范围,而非重新激活整个文件,大幅缩短检索时间。软件更新还将小对象从冷存储或磁带层的读取性能提升五倍以上。这些更新使基于磁带的归档系统能够作为响应迅速、可查询的数据湖运行,专为AI、分析和高性能计算工作负载设计。
Infinidat发布InfiniBox G4系列最新升级,实现容量翻倍、物理占用空间缩减31%、入门价格降低29%。新款InfiniBox SSA G4 F24仅占11个机架单元,起始容量77TB。混合系统单机架最大有效容量从17.2PBe跃升至33PBe,增幅达92%。系统原生集成S3对象存储协议,支持文件、块和对象存储统一管理,能效比竞品高7倍。