9月26日,乌镇世界互联网大会•互联网发展论坛上,阿里云自主研发的分布式存储系统“盘古”入选世界互联网领先科技成果,盘古解决了超大规模下数据不丢不错和高可用的难题,让存储更加稳定可靠、更大的容量和更高的性能,满足数字经济对海量存储和快速存储的需求 ,这也是第一次有存储技术入选世界互联网领先科技成果。

(2021世界互联网领先科技成果发布:阿里云盘古分布式存储)
数字经济时代,全社会迎来海量数据和多元化场景的井喷,在带来丰富业务创新的同时,也对存储提出了稳定性、可靠性、成本和性能等多维度的挑战。
大会表示,盘古是国产飞天云操作系统的关键技术之一,通过一套分布式的存储架构,支持规模无限扩展,可承载不同的应用负载, 覆盖低延迟、高吞吐、高并发等多个复杂场景,在大幅降低企业IT成本的同时,可靠性远超传统存储系统。今天的盘古系统广泛部署在全球数十个大型数据中心,服务阿里云上数百万的客户,覆盖互联网、政企、金融、企业等全行业,提供稳定可靠的存储能力。

“阿里云飞天操作系统代码”
“盘古是阿里云关键的创新技术之一”,阿里巴巴合伙人、阿里云基础产品负责人蒋江伟领奖时表示,“12年前,国产云计算操作系统飞天写下第一行代码,就是一位盘古工程师写的。阿里云将不断突破创新,为新基建提供更有价值的存储底座。”
据悉,盘古团队自2008年开始组建,2009年开始推出第一个版本,2013年完成单集群5000台服务器规模的上线和规模化使用,随后2015年突破了单集群上万台的技术门槛,2018年正式推出盘古2.0,单集群规模扩展能力突破十万台。

蒋江伟介绍,盘古独创了分布式数据冗余算法,支持跨数据中心,跨地域的多数据中心容灾策略,数据可靠性达到12个9,可用性高达5个9。其自研的高性能RDMA存储网络,HPCC流控算法和新型软硬融合存储引擎,引领云存储进入微秒延迟时代。
最近,阿里云发布了云“定义存储”(CDS:Cloud Defined Storage)产品,把盘古的能力和阿里云云存储的一致体验覆盖到客户多样化的部署场景。盘古在软硬融合领域持续精进和创新,在极致性能方面又迈上一个新的台阶,支撑了全新一代极致性能的块存储 ESSD PL-X 云盘,提供 30微秒的延迟、300万 IOPS、和 15GBytes/s的极致性能,满足数据库、实时计算、低延迟实时分析等场景对性能的需求,为客户提供更及时的实时决策和分析。
在新金融领域,民生银行基于盘古搭建分布式核心系统,建设成本降低90%,可支持未来十亿级客户规模扩展;在智慧城市建设上,珠海横琴基于阿里云建设跨境多维大数据服务云平台,实现了服务统一入口,衣食住行全覆盖……
此前阿里云已有多项自研技术当选,包括飞天云操作系统、PolarDB数据库、神龙云服务器架构等。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。