2024 年 3 月 4 日,中国上海 —— 全球内存与存储解决方案领先供应商 Micron Technology, Inc.(美光科技股份有限公司,纳斯达克股票代码:MU)近日宣布已开始量产其 HBM3E 高带宽内存 解决方案。英伟达 H200 Tensor Core GPU 将采用美光 8 层堆叠的 24GB 容量 HBM3E 内存,并于 2024 年第二季度开始出货。美光通过这一里程碑式进展持续保持行业领先地位,并且凭借 HBM3E 的超凡性能和能效为人工智能(AI)解决方案赋能。

HBM3E:推动人工智能革命
随着人工智能需求的持续激增,内存解决方案对于满足工作负载需求的增加至关重要。美光 HBM3E 解决方案通过以下优势直面这一挑战:
美光执行副总裁暨首席商务官 Sumit Sadana 表示:“美光凭借 HBM3E 这一里程碑式产品取得了三大成就:领先业界的上市时间、引领行业的性能和出众的能效表现。人工智能工作负载在很大程度上依赖于内存带宽和容量。美光拥有业界领先的 HBM3E 和 HBM4 产品路线图,以及为 AI 应用打造的 DRAM 和 NAND 全套解决方案,为助力人工智能未来的大幅增长做足了准备。”
美光利用其 1β(1-beta)技术、先进的硅通孔(TSV)和其他实现差异化封装解决方案的创新技术开发出业界领先的 HBM3E 设计。美光作为 2.5D/3D 堆叠和先进封装技术领域长久以来的存储领导厂商,有幸成为台积电 3Dfabric 联盟的合作伙伴成员,共同构建半导体和系统创新的未来。
美光将于 2024 年 3 月出样 12 层堆叠的 36GB 容量 HBM3E,提供超过 1.2TB/s 的性能和领先于竞品的卓越能效,从而进一步强化领先地位。美光将赞助 3 月 18 日开幕的英伟达 GTC 全球人工智能大会,届时将分享更多前沿 AI 内存产品系列和路线图。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。