从IO500双榜第一,看国产存储的系统级突破 原创

6月24日,ISC 2026高性能计算大会公布最新IO500榜单,中科曙光ParaStor F9000全闪存储系统包揽生产型全节点榜单和10节点榜单双榜第一,也是首个达成此成就的中国厂商,实现了历史性的零突破。

中国存储厂商再次站上全球榜单最高点。

6月24日,ISC 2026高性能计算大会公布最新IO500榜单,中科曙光ParaStor F9000全闪存储系统包揽生产型全节点榜单和10节点榜单双榜第一,也是首个达成此成就的中国厂商,实现了历史性的零突破。

成绩公布后,中科曙光北京公司总裁助理、分布式存储产品部总经理石静用八个字概括了自己的感受:“行稳致远、长期主义”。

从IO500双榜第一,看国产存储的系统级突破

从IO500双榜第一,看国产存储的系统级突破

生产型榜单,在真实业务中跑出来的成绩

从评价标准来看,IO500生产型榜单重点考察三个维度:第一是长期稳定性,系统在持续负载下是否保持性能不衰减;第二是复杂混合负载能力,能否同时处理大带宽顺序IO与高频小IO及元数据操作;第三是规模扩展一致性,在节点规模增加后性能是否仍然具备可预测性和可扩展性。

生产型榜单最大的特殊性在于“真实”。

首先是数据路径不能出现抖动,否则会被复杂负载迅速放大。与很多可以专门为测试优化的环境不同,IO500生产型榜单要求测试期间不能使集群中其他业务暂停。关键在于如何在不影响既有业务稳定性的前提下,依然把存储性能有效释放出来,并满足整体运行要求。

比如在这套生产系统里,本身就同时运行着多类应用。在此基础上叠加新测试或业务负载时,所有业务都会集中对存储系统形成压力。这背后体现的是系统在性能调度与多业务均衡方面的设计能力。

其次是多节点扩展后性能必须具备一致性,而不是局部最优。此次10节点榜单与全节点榜单虽然采用相同测试用例,但考察重点并不相同。前者注重扩展能力,后者注重单点效率。“带宽能力和元数据访问能力对存储系统压力的实现方式不同,如何用同一套存储架构应对不同类型的I/O压力,也是挑战所在。”石静说道。

最后是系统在高并发压力下必须保持长期稳定。IO500测试本身是一个持续时间较长的过程,相比短时间的性能冲刺,更关键的是在长周期运行中保持性能平稳,同时支撑多种业务并发运行。

从2U2N到PCle通道均衡设计,关键技术的自主创新

ParaStor F9000能够同时拿下两项榜单第一,背后离不开硬件架构和软件层面的创新。

硬件层面,ParaStor F9000采用全NVMe闪存架构,与市场上常见的2U24盘位全闪存储不同,中科曙光设计了独特的“2U2N”双子星架构,在2U空间内集成两个独立物理节点,每个节点都拥有独立的CPU、内存、网卡和SSD。

这种设计使数据路径实现简化,NVMe介质与高速网卡均直接连接CPU,中间不经过PCIe Switch转发,最大程度减少性能损耗,最大限度释放CPU的性能。

中科曙光还对SSD和高速网络所占用的PCIe通道进行了均衡设计,避免出现存储性能过剩而网络成为瓶颈,或者网络能力富余而存储跟不上的情况,实现存储介质性能与网络传输能力的同步释放。同时结合scaleFabric 400G高速网络,实现兼顾高带宽和低时延需求。

中科曙光高速网络互联产品部总工程师万伟表示,首款全栈自研400G无损高速网络scaleFabric采用原生无损RDMA架构,通过端到端零丢包保障低时延与高吞吐稳定性,并完全兼容InfiniBand生态,应用可无代码迁移。

软件层面,提供了精细化的QoS调度能力。针对不同业务场景,例如10节点测试与全节点测试,可以分别在文件系统、目录或计算节点维度设定带宽与IOPS的最低保障,同时支持突发资源机制,确保在高负载测试期间,核心业务性能稳定,同时避免对其他业务产生影响。

ParaStor F9000在关键技术上实现了自主创新。中科曙光北京公司分布式存储总架构师袁清波介绍,由于核心软硬件栈完全可控,使得存储系统可以在协议栈、数据路径、调度机制等多个层面进行深度协同优化,这也是ParaStor F9000能够在高负载场景下持续保持性能稳定的重要基础之一。

面向AI时代的存储系统底座能力

在AI体系中,存储正在从传统数据仓库转变为“AI数据引擎”。其角色不再局限于数据存放,而是延伸到数据流转调度、训练过程加速以及推理阶段支撑,尤其是在KV Cache、向量数据库以及高频访问数据路径中,存储已经深度参与计算过程。

ParaStor F9000专为AI训练场景量身打造,可提供从千卡到十万卡集群的整机柜交付方案,支持千亿级参数大模型部署时间缩短1倍,集群训练效率提升50%。

据介绍,ParaStor F9000首创AI存储三级协同方案,实现“以存提算、以存代算、以存降本”。

“以存提算”,本质是通过存储侧的数据路径优化与智能编排,把高频访问数据、训练关键数据尽可能前移到更高效的访问通道上,让GPU不再等待数据,而是持续获得稳定数据流,从系统层面提升算力利用率。

“以存代算”更多体现在对部分轻量数据处理与访问逻辑的下沉,比如在存储侧完成KV Cache相关数据的组织优化、向量检索加速以及部分预处理操作,把原本需要CPU参与的部分流程前移到数据层,减少计算链路中的无效搬运和重复计算。

“以存降本”则是通过数据分层与资源协同,让不同访问频率的数据落在不同介质与路径上,在保证性能的同时减少高成本资源占用,实现整体系统的资源最优配置。

自国家超算互联网核心节点启动建设以来,ParaStor F9000 已投入实际生产环境,目前该系统已在数万卡集群中稳定运行超过一年,在大模型训练科学计算与数据分析等关键场景中提供支撑。

可以说,国产存储在真实AI基础设施体系中,开始参与甚至在部分关键维度形成领先。并且这种领先是系统级能力、长期稳定性和规模化支撑能力的综合体现。

来源:至顶网存储频道

0赞

好文章,需要你的鼓励

2026

06/30

14:53

分享

点赞

邮件订阅