就在推出7.68TB QLC SSD仅仅数天之后,Micron(美光)公司就已经开始与英特尔进行NAND生产分离。美光公司首席执行官Sanjay Mehrotra及其高管和分析师分享了关于“New Micron”的未来愿景。
本周早些时候Mehrotra表示,市场正在向更多内存和存储需求转变。
他说:“边缘有数十亿台设备,不仅仅是个人电脑和智能手机,还有无人机、智能工厂、智能卡、智能城市,都在利用数据驱动数据经济......。”
他说,这其中最大的游戏规则改写者就是业界对深度学习/人工智能的集体尝试——“所有这些都是关于大规模大型数据池、快速处理以提供洞察力、为企业创造价值”。他将自然语言和计算机视觉处理作为“人工智能”类别下很显著的几个应用领域。他还提到另一个领域:自动驾驶。
Mehrotra向分析师们表示,与标准服务器相比,人工智能服务器需要6倍的DRAM和2倍的SSD。
美光认为,由于数据中心、移动设备、汽车和物联网领域的需求不断增长,这些年来一直呈现蓬勃发展的态势。
NAND并非全部......
Mehrotra谈到了他试图弥补美光以前滞后于行业发展所做的努力,并坦言美光在2D NAND方面已经落后于使用TLC内存的竞争对手。但至少现在来说情况不一样了,美光率先通过与英特尔的合作推出了QLC NAND。
美光表示将推动自己的技术发展以扩大现有的NAND和DRAM路线图,推进3D XPoint存储并开发新兴内存。此外美光还承诺提供高性能内存(HBM和图形卡),并管理NAND、SSD和3D XPoint等产品。
在描述XPoint的时候,Mehrotra的幻灯片重复了最初那个有争议的XPoint观点:10倍DRAM密度;1000倍的NAND耐用性,速度比NAND快10000倍。
美光表示,明年将交付NVMe客户端SSD,并通过NV-DIMM-N设备想永久内存转移。Micron还承诺在今年下半年推出1Ynm DRAM,并且还谈到了未来的1Znm工艺的优化、1αnm、技术集成和1β模块集成,并表示Micron已经有了清晰且自信的DRAM技术路线图,在多个节点上都有并行的进展。
96层NAND是Micron的第三代产品。美光宣称将利用Replacement Gate (RG)、CMOS阵列技术以及新的电荷陷阱单元技术、领先的裸片尺寸和性能特点,对4G 3D NAND进行性能和尺寸上的优化。层数没有透露,不过我们认为可能是128层左右。
与第三代96层NAND相比,第四代3D NAND的写入带宽将增加30%以上,每比特能耗降低40%多。
Mehrotra称,3D Xpoint和新兴内存产品将在2019年及以后出现,Micron在XPoint产品方面落后英特尔三年或更长时间。
展示给分析师的一张幻灯片上,显示出Micron新兴的内存产品和DRAM一样快,也更便宜。但技术基础是什么并没有透露。
美光新兴内存技术的幻灯片
开始与英特尔NAND制造联盟中脱离出来的美光,似乎正在成为一家更强大的半导体内存芯片和产品制造商。
好文章,需要你的鼓励
香港中文大学与华为诺亚方舟实验室合作开发了PreMoe框架,解决了大型混合专家模型(MoE)在内存受限设备上的部署难题。研究团队发现MoE模型中的专家表现出明显的任务专业化特征,据此提出了概率专家精简(PEP)和任务自适应专家检索(TAER)两大核心技术。实验证明,DeepSeek-R1 671B模型在精简50%专家后仍保持97.2%的MATH500准确率,内存需求降至688GB;而更激进的精简方案(减少87.5%专家)也能保持72.0%的准确率。该方法适用于多种MoE架构,为强大AI系统的广泛部署铺平了道路。
SCIENCEBOARD是一项开创性研究,旨在评估多模态自主智能体在真实科学工作流中的表现。研究团队构建了一个包含169个高质量任务的基准测试,涵盖生物化学、天文学等六个科学领域,并开发了一个真实环境让智能体通过CLI或GUI接口与科学软件交互。实验评估表明,即使是最先进的模型在这些复杂科学任务上的成功率也仅为15%,远低于人类表现,揭示了当前技术的局限性并为未来科学智能体的发展提供了宝贵见解。
帝国理工学院的研究团队开发了AlphaMed,这是首个仅通过极简规则强化学习就能培养医疗推理能力的AI模型,无需依赖传统的思维链示范数据。通过分析数据信息丰富度和难度分布的影响,研究发现高信息量的医疗问答数据是推理能力的关键驱动因素。AlphaMed在六个医疗问答基准上取得了领先成绩,甚至超越了更大的封闭源模型,同时展现出自发的步骤推理能力,为医疗AI发展提供了更加开放、高效的新路径。
Alita是一种新型通用AI代理系统,采用极简设计理念,以"最小预定义,最大自我进化"为原则构建。由普林斯顿大学等多家机构研究团队开发的Alita,只配备一个核心能力和少量通用模块,能自主创建所需工具并重用为模型上下文协议(MCPs)。实验显示,Alita在GAIA基准测试上达到87.27%的通过率,超越包括OpenAI Deep Research在内的复杂系统,证明简约设计可带来卓越性能。