2024 年 3 月 4 日,中国上海 —— 全球内存与存储解决方案领先供应商 Micron Technology, Inc.(美光科技股份有限公司,纳斯达克股票代码:MU)近日宣布已开始量产其 HBM3E 高带宽内存 解决方案。英伟达 H200 Tensor Core GPU 将采用美光 8 层堆叠的 24GB 容量 HBM3E 内存,并于 2024 年第二季度开始出货。美光通过这一里程碑式进展持续保持行业领先地位,并且凭借 HBM3E 的超凡性能和能效为人工智能(AI)解决方案赋能。
HBM3E:推动人工智能革命
随着人工智能需求的持续激增,内存解决方案对于满足工作负载需求的增加至关重要。美光 HBM3E 解决方案通过以下优势直面这一挑战:
美光执行副总裁暨首席商务官 Sumit Sadana 表示:“美光凭借 HBM3E 这一里程碑式产品取得了三大成就:领先业界的上市时间、引领行业的性能和出众的能效表现。人工智能工作负载在很大程度上依赖于内存带宽和容量。美光拥有业界领先的 HBM3E 和 HBM4 产品路线图,以及为 AI 应用打造的 DRAM 和 NAND 全套解决方案,为助力人工智能未来的大幅增长做足了准备。”
美光利用其 1β(1-beta)技术、先进的硅通孔(TSV)和其他实现差异化封装解决方案的创新技术开发出业界领先的 HBM3E 设计。美光作为 2.5D/3D 堆叠和先进封装技术领域长久以来的存储领导厂商,有幸成为台积电 3Dfabric 联盟的合作伙伴成员,共同构建半导体和系统创新的未来。
美光将于 2024 年 3 月出样 12 层堆叠的 36GB 容量 HBM3E,提供超过 1.2TB/s 的性能和领先于竞品的卓越能效,从而进一步强化领先地位。美光将赞助 3 月 18 日开幕的英伟达 GTC 全球人工智能大会,届时将分享更多前沿 AI 内存产品系列和路线图。
好文章,需要你的鼓励
生成式AI在电商领域发展迅速,但真正的客户信任来自可靠的购物体验。数据显示近70%的在线购物者会放弃购物车,主要因为结账缓慢、隐藏费用等问题。AI基础设施工具正在解决这些信任危机,通过实时库存监控、动态结账优化和智能物流配送,帮助商家在售前、售中、售后各环节提升可靠性,最终将一次性买家转化为忠实客户。
泰国SCBX金融集团开发的DoTA-RAG系统通过动态路由和混合检索技术,成功解决了大规模知识库检索中速度与准确性难以兼得的难题。系统将1500万文档的搜索空间缩小92%,响应时间从100秒降至35秒,正确性评分提升96%,为企业级智能问答系统提供了实用的技术方案。
存储供应商Qumulo发布多租户架构Stratus,为每个租户提供独立的虚拟环境,通过加密技术和租户专用密钥管理系统实现隔离。该统一文件和对象存储软件支持本地、边缘、数据中心及AWS、Azure等云环境部署。Stratus采用加密隔离技术确保敏感数据安全,同时提供任务关键操作所需的灵活性和效率,帮助联邦和企业客户满足合规要求。
中科院和字节跳动联合开发了VGR视觉锚定推理系统,突破了传统AI只能粗略"看图"的局限。该系统能在推理过程中主动关注图片关键区域,像人类一样仔细观察细节后再得出结论。实验显示VGR在图表理解等任务上性能大幅提升,同时计算效率更高,代表了多模态AI"可视化推理"的重要进展。