2024 年 3 月 4 日,中国上海 —— 全球内存与存储解决方案领先供应商 Micron Technology, Inc.(美光科技股份有限公司,纳斯达克股票代码:MU)近日宣布已开始量产其 HBM3E 高带宽内存 解决方案。英伟达 H200 Tensor Core GPU 将采用美光 8 层堆叠的 24GB 容量 HBM3E 内存,并于 2024 年第二季度开始出货。美光通过这一里程碑式进展持续保持行业领先地位,并且凭借 HBM3E 的超凡性能和能效为人工智能(AI)解决方案赋能。
HBM3E:推动人工智能革命
随着人工智能需求的持续激增,内存解决方案对于满足工作负载需求的增加至关重要。美光 HBM3E 解决方案通过以下优势直面这一挑战:
美光执行副总裁暨首席商务官 Sumit Sadana 表示:“美光凭借 HBM3E 这一里程碑式产品取得了三大成就:领先业界的上市时间、引领行业的性能和出众的能效表现。人工智能工作负载在很大程度上依赖于内存带宽和容量。美光拥有业界领先的 HBM3E 和 HBM4 产品路线图,以及为 AI 应用打造的 DRAM 和 NAND 全套解决方案,为助力人工智能未来的大幅增长做足了准备。”
美光利用其 1β(1-beta)技术、先进的硅通孔(TSV)和其他实现差异化封装解决方案的创新技术开发出业界领先的 HBM3E 设计。美光作为 2.5D/3D 堆叠和先进封装技术领域长久以来的存储领导厂商,有幸成为台积电 3Dfabric 联盟的合作伙伴成员,共同构建半导体和系统创新的未来。
美光将于 2024 年 3 月出样 12 层堆叠的 36GB 容量 HBM3E,提供超过 1.2TB/s 的性能和领先于竞品的卓越能效,从而进一步强化领先地位。美光将赞助 3 月 18 日开幕的英伟达 GTC 全球人工智能大会,届时将分享更多前沿 AI 内存产品系列和路线图。
好文章,需要你的鼓励
CoreWeave发布AI对象存储服务,采用本地对象传输加速器(LOTA)技术,可在全球范围内高速传输对象数据,无出口费用或请求交易分层费用。该技术通过智能代理在每个GPU节点上加速数据传输,提供高达每GPU 7 GBps的吞吐量,可扩展至数十万个GPU。服务采用三层自动定价模式,为客户的AI工作负载降低超过75%的存储成本。
清华大学、新加坡国立大学等顶尖高校联合发布重大AI研究成果,创新性地提出变分推理框架解决AI推理训练中的偏见问题。该方法将AI思考过程分解为思维轨迹和答案两部分,通过"思考教练"机制避免AI偏向简单问题的毛病。实验显示在数学、编程等多个领域均有显著提升,为构建更智能可靠的AI系统奠定基础。
谷歌DeepMind与核聚变初创公司CFS合作,运用先进AI模型帮助管理和改进即将发布的Sparc反应堆。DeepMind开发了名为Torax的专用软件来模拟等离子体,结合强化学习等AI技术寻找最佳核聚变控制方式。核聚变被视为清洁能源的圣杯,可提供几乎无限的零碳排放能源。谷歌已投资CFS并承诺购买其200兆瓦电力。
新加坡国立大学等机构研究团队提出反馈条件策略(FCP),让AI直接从文字反馈学习而非转换为数字评分。该方法在数学和通用推理任务上表现优异,能处理复杂混合反馈,支持灵活的行为控制,避免了传统强化学习中的奖励黑客问题,为AI训练开辟了新路径。