来自中国的一支科学家小组表示,3D XPoint本质上属于相变存储器,但英特尔与美光公司并未公开承认。
相变存储器(简称PCM)利用硫族化合物的特性确保其内部状态会随着不同的电阻水平在晶体与非晶体之间变化。不同状态可用于表示二进制的1或0。
英特尔公司指出,3D XPoint技术基于存储单元实现性质改变,但其本质上并不属于PCM。美光公司曾在2016年的采访当中表示,“与相变存储器不同,3D XPoint技术采用独特的交叉点结构,使其能够以相变存储器无法实现的方式进行规模扩展。”
科学家们在《中国信息科学》杂志发表了题为《从八面体结构母题到数据存储相变材料的亚纳秒相变》的研究论文,其中对此作出了讨论。
作者们回顾了相变随机存取存储器(PCRAM aka PCM)并宣称:
最近,这项技术已经被英特尔公司成功用于基于商业PCRAM的3D XPoint。
3D XPoint的成功商业化源于Ovonic存储器切换(OMS)、Ovonic阈值切换(OTS)选择器、受限结构以及大型金属字与位线等因素的结合。3D XPoint的存储单元属于基于相变原理的相变存储器(1R)。
作为驱动电路,OTS选择器(1S)亦采用与1R完美兼容的硫族化合物。
得益于OMS与OTS的简单结构,二者均采用金属/硫族元素化合物/金属结构,其易于实现3D集成,从而实现3D XPoint所承诺的大容量存储水平。
这显然是对英特尔论点的直接攻击。
我们向芯片巨头询问研究人员们的断言是否正确。该公司一位发言人:“英特尔公司尚未披露3D XPoint存储介质的具体材料,亦未公开英特尔Optane SSD与存储器中使用的底层存储介质或制造工艺。”
因此,如果它看起来像相变存储器、用起来也像相变存储器,那么……英特尔仍然拒绝承认。
好文章,需要你的鼓励
这篇研究论文介绍了"Speechless",一种创新方法,可以在不使用实际语音数据的情况下训练语音指令模型,特别适用于越南语等低资源语言。研究团队通过将文本指令转换为语义表示,绕过了对高质量文本转语音(TTS)系统的依赖。该方法分三个阶段:首先训练量化器将语音转为语义标记;然后训练Speechless模型将文本转为这些标记;最后用生成的合成数据微调大型语言模型。实验表明,该方法在越南语ASR任务中表现出色,为低资源语言的语音助手开发提供了经济高效的解决方案。
《Transformer Copilot》论文提出了一种革命性的大语言模型微调框架,通过系统记录和利用模型训练过程中的"错误日志"来提升推理性能。研究团队受人类学习者记录和反思错误的启发,设计了一个"副驾驶"模型来辅助原始"驾驶员"模型,通过学习错误模式并在推理时校正输出。这一方法在12个基准测试上使模型性能提升高达34.5%,同时保持计算开销最小,展现了强大的可扩展性和可迁移性,为大语言模型的优化提供了全新思路。
德克萨斯大学Austin分校的研究团队提出了RIPT-VLA,一种创新的视觉-语言-动作模型后训练范式。该方法通过让AI模型与环境互动并仅接收简单的成功/失败反馈来学习,无需复杂的奖励函数或价值模型。实验证明,RIPT-VLA能显著提升现有模型性能,在轻量级QueST模型上平均提升21.2%,将大型OpenVLA-OFT模型推至97.5%的前所未有成功率。最令人惊叹的是,仅用一个示范样本,它就能将几乎不可用的模型在15次迭代内从4%提升至97%的成功率,展现出卓越的数据效率和适应能力。
北京大学与华为诺亚方舟实验室研究团队共同开发了TIME基准,这是首个专为评估大语言模型在真实世界场景中的时间推理能力而设计的多层级基准。该研究提出了三个层级的时间推理框架,包含11个细粒度任务,并构建了涵盖38,522个问答对的数据集,针对知识密集型信息、快速变化的事件动态和社交互动中的复杂时间依赖性三大现实挑战。实验结果表明,即使是先进模型在构建时间线和理解复杂时间关系方面仍面临显著挑战,而测试时扩展技术可明显提升时间逻辑推理能力。