Gartner公司发布评估报告,称2023年企业存储的主要趋势包括云操作模型、新的SSD技术、针对勒索软件的网络安全,以及更好地对非结构化数据进行分析。
报告全文已经由网络存储与保护供应商RackTop Systems提供。
Gartner分析师们从一组战略规划假设入手,具体将九大趋势划分为三个类别:
这些议题对于关注存储行业的朋友来说肯定都不新鲜。各个趋势均由战略规划假设(SPA)来支撑,例如“到2028年,基于消费的STaaS将在企业存储资本支出中占比超35%,而2023年内这一比例还不足10%。”
Gartner随后又列出三个子标题,分别为:常规存储、非结构化数据存储和块存储,并邀请分析师具体对这九大趋势做出解释。
存储即服务——托管STaaS由存储供应商的软件及/或设备提供支持,负责提供企业功能集、可用性和性能,同时支持与云类似的消费模式。
网络存储——到2028年,100%的存储产品都将引入主动防御设计,包括常规网络事件恢复之外的更多其他网络存储功能;相比之下,2023年初这一比例还仅为10%。大多数主要存储供应商都在积极开发这些网络存储功能,未来这些功能可能被纳入存储系统,也可以作为单独产品交付。初创企业则正在发布支持异构功能的产品,借以保护数据块、文件和对象存储等格式的企业数据。
QLC闪存——到2027年,企业所使用的QLC闪存介质将在全部闪存存储中占比2%,远高于2022年底的5%。相对于之前的三级单元(TLC)存储阵列,QLC拥有显著的成本增量优势,此外更强的耐用性和存储性能也将为企业客户带来长期收益(例如,可在勒索软件后的恢复阶段快速完成数据还原)。
文件与对象存储统一平台——到2028年,70%的文件和对象数据将部署在统一的非结构化数据存储平台之上,比例远高于2023年初的35%。文件和对象数据的统一平台支持将整合所有涉及非结构化数据的工作负载,这不仅简化了存储操作,同时也简化了存储设施的采购过程。
数据存储管理服务——到2027年,至少40%的组织将部署用于执行数据分类、解析和优化的存储管理解决方案,高于2023年初的15%。
混合云文件数据服务——到2027年,60%的基础设施和运营领导者将实施混合云文件部署,比例远高于2023年初的20%。这意味着将非结构化数据整合至单一副本当中,从而围绕底层数据的安全保护进行集中化管理,从而简化运营、适配具体使用场景。由此带来的可预期收益包括成本优化,即使存储成本与数据价值保持一致;数据治理,保证敏感数据始终应用正确的保护与留存策略;数据安全,即建立适当的权限级别与访问控制;增强分析工作流,即利用数据分类及可选自定义元数据做好数据标记。
NVMe over Fabric——到2027年,25%的企业组织将部署NVMe-oF作为存储网络协议,高于2023年年中的不足10%。在NVMe-oF选项当中,NVMe TCP最值得一提,其在本地环境下仅须承担以太网使用成本,且简单性与带宽传输能力分别可与iSCSI和低端光纤通道SAN(即最高不超过16 Gbit/秒)相媲美。此外,NVMe-oF还能通过高可用性功能扩展至更高容量级别,并立足中心位置进行管理,同时为数十个计算客户端提供服务。
容器原生存储——到2027年,将有80%的Kubernetes部署匹配有持久容器存储提供的高级功能,远高于2023年初的30%比例。虽然容器技术在设计上强调无状态性,但目前用于容纳持久数据的有状态应用部署量一直不断增加。在尝试做Kubernetes早期部署时,理想的起点仍是采用传统存储方法,而容器存储接口(CSI)现在已经能够抽象掉整个底层存储平台。
“自给自足”型NVMe SSD——所谓“自给自足”(captive),是Gartner描述计算存储SSD执行板载压缩等任务的具体方式。到2026年,“自给自足”型NVMe SSD将占据本地存储容量中的30%以上,远高于2023年年中的不足5%。“自给自足”型NVMe SSD能够带来一系列助益,包括更强大的存储操作、显著节约使用成本,以及更具弹性和智能的数据存储服务环境。
Gartner公司表示,“以上趋势源自企业数据管理需求呈现出的爆发式增长,业务部门需要以类云形式匠内部部署消费模型来缓解网络攻击风险,或者利用QLC/NVMe over Fabric等最新存储技术实现更优的成本及/或性能。”
报告指出,IT领导者应当利用这些技术趋势来建立起灵活、敏捷的存储平台,积极响应实际业务需求。
事实上,反应迅速的企业已经迈出了重要的第一步。而Gartner的分析师们这次开出了“诊断”,提醒那些行动迟缓、心存犹豫的用户:没错,你们也该行动了。
好文章,需要你的鼓励
香港中文大学与华为诺亚方舟实验室合作开发了PreMoe框架,解决了大型混合专家模型(MoE)在内存受限设备上的部署难题。研究团队发现MoE模型中的专家表现出明显的任务专业化特征,据此提出了概率专家精简(PEP)和任务自适应专家检索(TAER)两大核心技术。实验证明,DeepSeek-R1 671B模型在精简50%专家后仍保持97.2%的MATH500准确率,内存需求降至688GB;而更激进的精简方案(减少87.5%专家)也能保持72.0%的准确率。该方法适用于多种MoE架构,为强大AI系统的广泛部署铺平了道路。
SCIENCEBOARD是一项开创性研究,旨在评估多模态自主智能体在真实科学工作流中的表现。研究团队构建了一个包含169个高质量任务的基准测试,涵盖生物化学、天文学等六个科学领域,并开发了一个真实环境让智能体通过CLI或GUI接口与科学软件交互。实验评估表明,即使是最先进的模型在这些复杂科学任务上的成功率也仅为15%,远低于人类表现,揭示了当前技术的局限性并为未来科学智能体的发展提供了宝贵见解。
帝国理工学院的研究团队开发了AlphaMed,这是首个仅通过极简规则强化学习就能培养医疗推理能力的AI模型,无需依赖传统的思维链示范数据。通过分析数据信息丰富度和难度分布的影响,研究发现高信息量的医疗问答数据是推理能力的关键驱动因素。AlphaMed在六个医疗问答基准上取得了领先成绩,甚至超越了更大的封闭源模型,同时展现出自发的步骤推理能力,为医疗AI发展提供了更加开放、高效的新路径。
Alita是一种新型通用AI代理系统,采用极简设计理念,以"最小预定义,最大自我进化"为原则构建。由普林斯顿大学等多家机构研究团队开发的Alita,只配备一个核心能力和少量通用模块,能自主创建所需工具并重用为模型上下文协议(MCPs)。实验显示,Alita在GAIA基准测试上达到87.27%的通过率,超越包括OpenAI Deep Research在内的复杂系统,证明简约设计可带来卓越性能。