据IDC预测数据显示,到2028年,全球将产出394ZB数据,其中,仅仅是AI生成的图片和视频数据相较于2024年就会增长167倍。
人工智能技术热潮对数据存储提出了新需求。
在华为中国合作伙伴大会2025上,华为数据存储产品线总裁周跃峰分析了人工智能时代存储产品面临的新趋势。
他指出,AI数据湖正在成为企业构建AI基础设施的核心,存储全闪化已成大势所趋,与此同时,企业IT架构正在向着存算分离方向演进。
我们在华为中国合作伙伴大会2025现场,聆听了周跃峰博士对于这些趋势的判断与分析,以及“伙伴+华为”面向人工智能时代打造的创新存储解决方案。
如何构建AI-Ready的IT基础设施?
随着生成式AI技术带来的变革效应日益凸显,越来越多企业开始关注生成式AI技术,据Gartner预测数据显示,到2026年,超过80%的企业将使用生成式AI的API或模型,或在生产环境中部署支持生成式AI的应用。
面对传统企业对于人工智能技术的高需求,AI-Ready的IT基础设施构建已经迫在眉睫。
周跃峰指出,“对于企业而言,构建AI-Ready的基础设施,本质上就是构建一个数据可共享、可流动,具备AI工具链,使能数据工程和模型工程的AI数据湖。”
那么,哪些传统企业有机会率先构建起自己的AI数据湖,并推动人工智能技术在产业中应用落地?
周跃峰指出,“一定是数据量大,数据质量高的行业率先进行人工智能产业化落地。”
例如,在医疗领域,经过数字化建设已经具备丰富的语料信息,而医生在数字系统中的诊断批注信息完成了大部分数据标注和数据清洗工作,这样高质量的海量数据正是训练和调优医疗领域垂类大模型最需要的。
这也是为什么大模型能够率先在医疗领域应用到了诸如病例诊断、影像诊断等场景中。
为了推动数据量大、数据质量高的行业率先构建起自己的AI数据湖,华为从底层的数据湖存储到数据管理、AI工具链、应用与运用构建起了一套完整的解决方案。其中,在应用与运营层,“伙伴+华为”面向模型训练和推理、AI智能体、资产发布、可信共享等领域打造了一系列产品。
DCS AI全栈解决方案是华为为了解决人工智能技术行业落地过程中最为复杂的数据工程和模型工程问题,推动人工智能技术产业落地的一套解决方案。
在DCS AI全栈解决方案中,最为关键的是ModelEngine工具链,借助ModelEngine的能力,可以使能数据工程和模型工程,实现高效的数据编排、模型编排和应用对接。
在华为中国合作伙伴大会2025上,华为官方也正式对外官宣了ModelEngine工具链的开源。
这意味着现在所有开发团队都可以通过ModelEngine解决数据工程耗时长、应用对接难度大、AI集群可用度低等问题,由此解决AI数据湖构建中的诸多难题。
闪存时代浪潮,加速存储闪存化
2022年12月,国家正式对外发布“数据二十条”,从数据产权、流通交易、收益分配、安全治理等方面构建了数据基础制度,提出了20条政策举措,次年10月,国家数据局正式挂牌成立。
作为人工智能三要素,数据在人工智能时代变得越来越重要,数据逐渐成为公司重要资产,海量数据面临着随时被访问和长时间保存的需求,以香港天文台数据应用为例,数据分析处理需求从以往的2PB提升到了现在的100PB,数据存储留存时间从以往的7年提升到了现在的40年。
过往关于数据的“热、温、冷”三类数据分类,其中的冷数据随着数据资产化将变得越来越少,这就需要我们重新考虑存储介质问题。
周跃峰指出,“未来SSD将替换HDD成为主流数据存储介质。”
他在大会上表示,“虽然时至今日SSD的采购价格依然远远高于HDD,但如果考虑十年使用时间内的耗电和机房各类配套设施费用,我们相信SSD的综合使用成本要远远低于HDD,因此,我们呼吁大家要用更先进的SSD构建数据中心。”
为了推动存储闪存化,华为对外发布了OceanStor Pacific系列全闪分布式存储产品,这一产品拥有2PB/2U的高容量密度和0.5W/TB的低能耗,在空间、容量、能耗方面都有更好的表现。
人工智能时代的数据存储能力和作用也发生了重大变化,大模型在训练过程中,需要存储产品能够高速吞吐数据并保证万卡集群一致性的读写访问,大模型在推理过程中,还需要存储产品可以以存代算,并在长序列推理过程中发挥更大的作用。
针对AI训练和推理场景,华为OceanStor A800通过存储增强计算,让AI集群的利用率提升了30%,通过多级KV Cache技术,让大模型推理具备了长记忆能力,并让推理效率提升了5倍。
这是华为面向人工智能时代在存力上的强化,也是加速存储闪存化,是“伙伴+华为”打造面向各行各业人工智能存储解决方案的基础。
打造面向人工智能时代存储解决方案
人工智能时代,企业IT基础架构也发生了空前的变化,其中一个重要变化是,企业IT架构正在面向存算分离方向持续演进。
当数据量越来越大时,在企业IT架构中的存储资源和计算资源的分配一定是相对隔离的,存算分离模式会让企业IT架构更合理、高效的运行。
以金融行业为例,金融行业的数据库改造工作经历了分离部署、共享存储、三层结构三个阶段,如今的金融行业正在积极进行分布式数据库改造,通过存算分离架构,金融行业的可靠性、可管理性和性能正在得到快速提升。
在存算分离上,全球头部互联网公司的动作要更快一步,诸如谷歌、亚马逊已经在通过将服务器中的硬盘取出,并通过智能盘框做集中化、高效的管理。
同样为了帮助企业实现更高效的存算分离IT架构,华为推出了智能盘框OceanDisk产品,据悉,OceanDisk是Diskless架构下数据中心的标准存储部件,基于传统盘框的智能升级,具备专业存储的相关软硬件能力,OceanDisk在替换服务器本地盘时,上层分布式软件可与OceanDisk智能盘框无感适配,实现透明访问。
值得注意的是,为了打造人工智能时代的数据安全防护技术,华为早在2024年就推出了三合一备份系统OceanProtect备份一体机,并开源了华为的备份软件open-eBackup。
面向“伙伴+华为”体系,华为还曾在2023年推出DME IQ一站式作业平台,在华为中国合作伙伴大会2025上,周跃峰官宣了这一平台的智能化升级——结合AI功能,让DME IQ一站式作业平台更智能。
2025年是人工智能应用落地元年,存储作为企业IT基础设施重要组成部分,华为打造了从核心生产交易到海量数据备份、归档一系列工具和产品,这些也都是“伙伴+华为”面向各行各业打造人工智能存储解决方案的重要基石,并由此为人工智能规模化应用落地铺平道路。
好文章,需要你的鼓励
OpenAI 宣布重大升级:ChatGPT 现可记忆用户全部历史对话,并据此调整回复。这项功能将使 ChatGPT 随时间更了解用户,提供个性化响应。新功能包括"引用保存的记忆"和"引用聊天历史",目前仅向付费用户开放。虽然提升了实用性,但也引发了隐私方面的担忧。
本文探讨了人工智能聊天机器人对人类情感和关系的潜在影响。作者指出,虽然AI可以模仿关怀,但缺乏真实情感,可能导致人们对亲密关系的期望发生改变。特别是对儿童来说,过度依赖AI可能阻碍情感发展。文章呼吁我们要警惕AI带来的长期影响,保持人际交往的真实性。
AI革命的下一波浪潮不仅仅关乎拥有AI技术,更在于拥有能让AI真正理解业务的人才。虽然媒体关注的是构建大语言模型和复杂AI代理的工程师,但在前瞻性公司的分析部门中,一场悄然革命正在酝酿:AI分析师的兴起。这个角色将成为连接AI技术与业务实践的关键纽带,对企业数字化转型至关重要。
Google 推出了 Firebase Studio,这是一个基于云的人工智能辅助开发环境。它结合了 Project IDX、GenKit 和 Gemini 等技术,旨在帮助开发者快速原型设计和构建应用程序。然而,一些开发者反馈称,目前该工具的 AI 功能还不够成熟,难以生成高质量的可用代码。这表明 AI 辅助开发工具虽有潜力,但仍无法完全取代专业开发人员的技能和经验。