据IDC预测数据显示,到2028年,全球将产出394ZB数据,其中,仅仅是AI生成的图片和视频数据相较于2024年就会增长167倍。
人工智能技术热潮对数据存储提出了新需求。
在华为中国合作伙伴大会2025上,华为数据存储产品线总裁周跃峰分析了人工智能时代存储产品面临的新趋势。
他指出,AI数据湖正在成为企业构建AI基础设施的核心,存储全闪化已成大势所趋,与此同时,企业IT架构正在向着存算分离方向演进。
我们在华为中国合作伙伴大会2025现场,聆听了周跃峰博士对于这些趋势的判断与分析,以及“伙伴+华为”面向人工智能时代打造的创新存储解决方案。
如何构建AI-Ready的IT基础设施?
随着生成式AI技术带来的变革效应日益凸显,越来越多企业开始关注生成式AI技术,据Gartner预测数据显示,到2026年,超过80%的企业将使用生成式AI的API或模型,或在生产环境中部署支持生成式AI的应用。
面对传统企业对于人工智能技术的高需求,AI-Ready的IT基础设施构建已经迫在眉睫。
周跃峰指出,“对于企业而言,构建AI-Ready的基础设施,本质上就是构建一个数据可共享、可流动,具备AI工具链,使能数据工程和模型工程的AI数据湖。”
那么,哪些传统企业有机会率先构建起自己的AI数据湖,并推动人工智能技术在产业中应用落地?
周跃峰指出,“一定是数据量大,数据质量高的行业率先进行人工智能产业化落地。”
例如,在医疗领域,经过数字化建设已经具备丰富的语料信息,而医生在数字系统中的诊断批注信息完成了大部分数据标注和数据清洗工作,这样高质量的海量数据正是训练和调优医疗领域垂类大模型最需要的。
这也是为什么大模型能够率先在医疗领域应用到了诸如病例诊断、影像诊断等场景中。

为了推动数据量大、数据质量高的行业率先构建起自己的AI数据湖,华为从底层的数据湖存储到数据管理、AI工具链、应用与运用构建起了一套完整的解决方案。其中,在应用与运营层,“伙伴+华为”面向模型训练和推理、AI智能体、资产发布、可信共享等领域打造了一系列产品。
DCS AI全栈解决方案是华为为了解决人工智能技术行业落地过程中最为复杂的数据工程和模型工程问题,推动人工智能技术产业落地的一套解决方案。
在DCS AI全栈解决方案中,最为关键的是ModelEngine工具链,借助ModelEngine的能力,可以使能数据工程和模型工程,实现高效的数据编排、模型编排和应用对接。

在华为中国合作伙伴大会2025上,华为官方也正式对外官宣了ModelEngine工具链的开源。
这意味着现在所有开发团队都可以通过ModelEngine解决数据工程耗时长、应用对接难度大、AI集群可用度低等问题,由此解决AI数据湖构建中的诸多难题。
闪存时代浪潮,加速存储闪存化
2022年12月,国家正式对外发布“数据二十条”,从数据产权、流通交易、收益分配、安全治理等方面构建了数据基础制度,提出了20条政策举措,次年10月,国家数据局正式挂牌成立。
作为人工智能三要素,数据在人工智能时代变得越来越重要,数据逐渐成为公司重要资产,海量数据面临着随时被访问和长时间保存的需求,以香港天文台数据应用为例,数据分析处理需求从以往的2PB提升到了现在的100PB,数据存储留存时间从以往的7年提升到了现在的40年。
过往关于数据的“热、温、冷”三类数据分类,其中的冷数据随着数据资产化将变得越来越少,这就需要我们重新考虑存储介质问题。
周跃峰指出,“未来SSD将替换HDD成为主流数据存储介质。”
他在大会上表示,“虽然时至今日SSD的采购价格依然远远高于HDD,但如果考虑十年使用时间内的耗电和机房各类配套设施费用,我们相信SSD的综合使用成本要远远低于HDD,因此,我们呼吁大家要用更先进的SSD构建数据中心。”

为了推动存储闪存化,华为对外发布了OceanStor Pacific系列全闪分布式存储产品,这一产品拥有2PB/2U的高容量密度和0.5W/TB的低能耗,在空间、容量、能耗方面都有更好的表现。

人工智能时代的数据存储能力和作用也发生了重大变化,大模型在训练过程中,需要存储产品能够高速吞吐数据并保证万卡集群一致性的读写访问,大模型在推理过程中,还需要存储产品可以以存代算,并在长序列推理过程中发挥更大的作用。
针对AI训练和推理场景,华为OceanStor A800通过存储增强计算,让AI集群的利用率提升了30%,通过多级KV Cache技术,让大模型推理具备了长记忆能力,并让推理效率提升了5倍。
这是华为面向人工智能时代在存力上的强化,也是加速存储闪存化,是“伙伴+华为”打造面向各行各业人工智能存储解决方案的基础。
打造面向人工智能时代存储解决方案
人工智能时代,企业IT基础架构也发生了空前的变化,其中一个重要变化是,企业IT架构正在面向存算分离方向持续演进。
当数据量越来越大时,在企业IT架构中的存储资源和计算资源的分配一定是相对隔离的,存算分离模式会让企业IT架构更合理、高效的运行。
以金融行业为例,金融行业的数据库改造工作经历了分离部署、共享存储、三层结构三个阶段,如今的金融行业正在积极进行分布式数据库改造,通过存算分离架构,金融行业的可靠性、可管理性和性能正在得到快速提升。

在存算分离上,全球头部互联网公司的动作要更快一步,诸如谷歌、亚马逊已经在通过将服务器中的硬盘取出,并通过智能盘框做集中化、高效的管理。
同样为了帮助企业实现更高效的存算分离IT架构,华为推出了智能盘框OceanDisk产品,据悉,OceanDisk是Diskless架构下数据中心的标准存储部件,基于传统盘框的智能升级,具备专业存储的相关软硬件能力,OceanDisk在替换服务器本地盘时,上层分布式软件可与OceanDisk智能盘框无感适配,实现透明访问。
值得注意的是,为了打造人工智能时代的数据安全防护技术,华为早在2024年就推出了三合一备份系统OceanProtect备份一体机,并开源了华为的备份软件open-eBackup。
面向“伙伴+华为”体系,华为还曾在2023年推出DME IQ一站式作业平台,在华为中国合作伙伴大会2025上,周跃峰官宣了这一平台的智能化升级——结合AI功能,让DME IQ一站式作业平台更智能。
2025年是人工智能应用落地元年,存储作为企业IT基础设施重要组成部分,华为打造了从核心生产交易到海量数据备份、归档一系列工具和产品,这些也都是“伙伴+华为”面向各行各业打造人工智能存储解决方案的重要基石,并由此为人工智能规模化应用落地铺平道路。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。