2024 年 3 月 4 日,中国上海 —— 全球内存与存储解决方案领先供应商 Micron Technology, Inc.(美光科技股份有限公司,纳斯达克股票代码:MU)近日宣布已开始量产其 HBM3E 高带宽内存 解决方案。英伟达 H200 Tensor Core GPU 将采用美光 8 层堆叠的 24GB 容量 HBM3E 内存,并于 2024 年第二季度开始出货。美光通过这一里程碑式进展持续保持行业领先地位,并且凭借 HBM3E 的超凡性能和能效为人工智能(AI)解决方案赋能。

HBM3E:推动人工智能革命
随着人工智能需求的持续激增,内存解决方案对于满足工作负载需求的增加至关重要。美光 HBM3E 解决方案通过以下优势直面这一挑战:
美光执行副总裁暨首席商务官 Sumit Sadana 表示:“美光凭借 HBM3E 这一里程碑式产品取得了三大成就:领先业界的上市时间、引领行业的性能和出众的能效表现。人工智能工作负载在很大程度上依赖于内存带宽和容量。美光拥有业界领先的 HBM3E 和 HBM4 产品路线图,以及为 AI 应用打造的 DRAM 和 NAND 全套解决方案,为助力人工智能未来的大幅增长做足了准备。”
美光利用其 1β(1-beta)技术、先进的硅通孔(TSV)和其他实现差异化封装解决方案的创新技术开发出业界领先的 HBM3E 设计。美光作为 2.5D/3D 堆叠和先进封装技术领域长久以来的存储领导厂商,有幸成为台积电 3Dfabric 联盟的合作伙伴成员,共同构建半导体和系统创新的未来。
美光将于 2024 年 3 月出样 12 层堆叠的 36GB 容量 HBM3E,提供超过 1.2TB/s 的性能和领先于竞品的卓越能效,从而进一步强化领先地位。美光将赞助 3 月 18 日开幕的英伟达 GTC 全球人工智能大会,届时将分享更多前沿 AI 内存产品系列和路线图。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。