2024 年 5 月 9 日,中国上海 – Micron Technology Inc.(美光科技股份有限公司,纳斯达克股票代码:MU)近日宣布在业界率先验证并出货基于大容量 32Gb 单块 DRAM 芯片的128GB DDR5 RDIMM 内存,其速率在所有主流服务器平台上均高达 5,600 MT/s。该款 128GB DDR5 RDIMM 内存采用美光行业领先的 1β(1-beta) 制程技术,相较于采用 3DS 硅通孔(TSV)技术的竞品,容量密度提升 45% 以上,[1]能效提升高达 22%,[2]延迟降低高达 16%1。
美光与行业领先的厂商及客户合作,推动了这些高性能、大容量新模组在高吞吐量服务器 CPU 上的广泛应用。该款高速率内存模组特别针对数据中心常见的任务关键型应用,包括人工智能(AI)和机器学习(ML)、高性能计算(HPC)、内存数据库(IMDB)以及需要对多线程、多核通用计算工作负载进行高效处理的场景,满足它们的性能需求。美光 128GB DDR5 RDIMM 内存模组获得了强大的生态支持,包括 AMD、HPE、英特尔、Supermicro 等众多公司。
美光副总裁暨计算产品事业群总经理 Praveen Vaidyanathan 表示:“随着该款产品批量出货里程碑的达成,美光继续引领市场,为客户提供通过各主流 CPU 平台认证的大容量 RDIMM。目前,AI 服务器可搭载美光的 24GB 8 层堆叠 HBM3E 作为 GPU 附加内存,以及美光的 128GB RDIMM 作为 CPU 附加内存,从而提供内存密集型工作负载所需的大容量、高带宽及低功耗的基础设施。”
行业应用
AMD 高级副总裁暨服务器事业部总经理 Dan McNamara 表示:“我们与美光合作的宗旨在于,通过高性能内存来提升数据中心基础设施的能力,以应对计算密集型工作负载的需求。通过此次合作,我们共同的客户可以在搭载 AMD EPYC(霄龙)CPU 的服务器上立即体验到美光大容量 DDR5 内存带来的显著优势,从而实现现代数据中心所需的性能和效率。”
HPE 高级副总裁兼主流计算总经理 Krista Satterthwaite 表示:“在 AI 的训练、调优及推理阶段,采用先进的内存技术,并同时确保高性能和高效率,对于支持不断增长的 AI 工作负载至关重要。我们致力于提供最高性能、低功耗的解决方案,并计划通过与美光的合作,在我们的 AI 产品组合中全面采用单块高密度 DRAM,帮助企业客户获得最佳性能,应对各种工作负载。”
英特尔内存与 IO 技术副总裁 Dimitrios Ziakas 博士表示:“美光 128GB DDR5 RDIMM 内存是首款基于 32Gb 单块 DRAM 芯片的大容量 DIMM 产品,已完成第四代和第五代英特尔® 至强® 处理器平台上的内存兼容性认证。该款基于 32Gb 单块 DRAM 芯片的 DDR5 内存模组可加速关键服务器和 AI 系统配置,为基于英特尔® 至强® 处理器的系统带来关键的性能、容量和最至关重要的能效优势。我们很高兴继续与美光合作,推动创新产品在市场上的广泛应用,解决 AI 和服务器客户面临的内存容量和能耗瓶颈问题。”
Supermicro 联合创始人兼业务发展高级副总裁 Wally Liaw表示:“Supermicro 基于英伟达、AMD 和英特尔打造业界最广泛的加速服务器和解决方案组合,引领行业前行。有远见的客户正致力于在 AI 基础设施中实现大内存空间、高性能和高效率的改进。我们很高兴与美光合作,共同实现这一突破。通过搭载全新基于 32Gb 单块DRAM芯片的 128GB 内存模组,Supermicro 先进的 GPU SuperServers 将为客户提供显著的优势。”
美光 128GB DDR5 RDIMM 内存模组已开售,现可直接从美光购买,并将于 2024 年 6 月起通过全球部分渠道分销商和经销商对外供应。美光为数据中心提供全面的内存产品组合,提供涵盖 DDR5 RDIMM、MCRDIMM、MRDIMM、CXL 和 LPDDR5x 等外形规格的一系列内存产品,助力客户轻松集成这些优化的解决方案,满足 AI 和高性能计算(HPC)应用对于高带宽、大容量和低功耗的需求。
[1] 基于竞品的数据表和 JEDEC 规范。
[2] 与 SK 海力士的 5,600 MT/s 3DS TSV 产品相比,美光 5,600 MT/s 128GB DDR5 RDIMM 内存的能效提升 22.2%。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。