内存短缺的情况比大多数人最初想象的更加严重。随着AI驱动的超大规模数据中心和云服务提供商持续对供应链造成压力,DRAM和NAND闪存的价格预计将在2026年第一季度大幅上涨。
行业观察机构TrendForce在1月初曾警告称,从智能手机到服务器等各类设备使用的DRAM合约价格可能在2026年第一季度环比上涨55-60%。与此同时,用于固态存储的NAND闪存价格预计上涨33-38%。
本周,TrendForce修订了其预测,分析师现在预计DRAM合约价格将环比飙升90-95%,而NAND价格预计在本季度上涨55-60%。
虽然AI需求是主要原因,但TrendForce指出,2025年第四季度PC出货量高于预期,进一步加剧了短缺问题。
据此前报道,戴尔和惠普等OEM厂商通常会提前约一年批量采购内存。如果你注意到OEM整机价格保持稳定,而独立内存套件价格却翻了三倍,这就是部分原因。但随着库存逐渐消耗,OEM厂商开始补货,预计系统价格将会攀升。
TrendForce现在预计PC DRAM价格将比假日季度大约翻一番。该机构预测,笔记本电脑和其他焊接RAM系统以及智能手机使用的LPDDR内存也将出现类似的大幅涨幅。TrendForce预测LPDDR4x和LPDDR5x内存的价格将环比上涨约90%,这是"历史上最陡峭的涨幅"。
虽然LPDDR内存到目前为止主要用于笔记本电脑,但英伟达最强大的机架系统每台包含54TB的LPDDR5x内存,这无疑让情况雪上加霜。
随着超大规模数据中心和云服务提供商争相部署尽可能多的SSD来支持AI推理工作负载,NAND闪存价格预计也将在本季度飙升。
TrendForce写道:"随着由推理驱动的AI应用持续增长,对高性能存储的需求远超最初预期。自2025年末以来,北美领先的云服务提供商一直在快速增加采购,导致企业级SSD订单激增。"
随着AI基础设施继续从以训练为主转向以推理为主导的领域,需要更多的DRAM和存储空间。
在大语言模型推理期间,模型状态存储在称为键值缓存的结构中。可以将其视为模型的短期记忆。在活跃使用期间,如聊天机器人会话,这个KV缓存会被计算并通常存储在HBM中。当会话空闲时,预计算的KV缓存会被推送到较慢的系统内存,在许多情况下最终会下降到存储层。
通过存储KV缓存,推理服务提供商可以大幅减少扩展多会话推理所需的计算量,同时改善用户的交互体验。
所有这一切的缺点是,存储所有这些预计算的KV缓存需要大量内存。
如果你期待从内存寒冬中得到缓解,不要抱太大希望。虽然内存供应商现在有资金建设新工厂,但这些设施需要数年时间才能投入使用。
如前所述,虽然DRAM价格预计将在今年晚些时候达到峰值,但要恢复正常还需要数年时间。预计价格将在2028年之前保持高位。
Q&A
Q1:为什么2026年第一季度DRAM和NAND闪存价格会大幅上涨?
A:主要原因是AI驱动的超大规模数据中心和云服务提供商对内存需求激增,持续对供应链造成压力。此外,2025年第四季度PC出货量高于预期也进一步加剧了短缺问题。DRAM合约价格预计环比飙升90-95%,NAND价格预计上涨55-60%。
Q2:AI推理为什么需要这么多内存和存储空间?
A:在大语言模型推理过程中,模型状态存储在键值缓存(KV cache)中,这相当于模型的短期记忆。活跃会话时KV缓存存储在HBM中,空闲时会转移到系统内存,最终可能存入存储层。通过存储预计算的KV缓存,可以减少计算量并改善用户体验,但这需要大量内存空间。
Q3:内存价格什么时候能恢复正常水平?
A:短期内难以恢复。虽然内存供应商现在有资金建设新工厂,但这些设施需要数年时间才能投入使用。根据预测,DRAM价格预计将在2026年晚些时候达到峰值,但价格将在2028年之前保持高位,恢复正常还需要数年时间。
好文章,需要你的鼓励
今天讲的出海案例是源杰科技,一家专注磷化铟激光器芯片的IDM(整合设备制造商)企业,2024年11月同步宣布赴港发行H股、并向美国华盛顿州子公司增资不超过5000万美元建设生产基地。
这项研究揭示了AI解释方法的重大转变:传统方法适用于单一预测任务,但面对能够多步推理、使用工具的智能体系统时显得力不从心。研究团队提出了轨迹级解释框架,能够准确诊断智能体在执行过程中的具体失败点,为下一代AI系统的透明化和可靠性提供了重要基础。
脑机接口领域投资热潮持续,中国首家超声脑机接口公司Gestala成立仅两个月就完成2160万美元融资,估值达1-2亿美元。该公司开发非侵入式超声脑机接口技术,旨在解决传统植入式设备需要手术的风险问题。创始人表示将利用资金进行研发、团队扩张和建设生产设施,目标年底完成首代原型。公司专注慢性疼痛管理等医疗应用,并计划利用中国制造优势和低成本临床试验加速产品开发。
加州大学洛杉矶分校研究团队开发了TIC-VLA机器人导航系统,解决了传统机器人"思考"与"行动"无法同步的核心问题。该系统采用双核心设计,一个负责语言理解和场景分析,另一个负责实时避障控制,通过"延迟语义控制接口"实现异步协作。在DynaNav仿真平台测试中成功率达55.29%,真实环境测试成功率达85%,为服务机器人、医疗辅助、物流仓储等领域提供了重要技术突破。