IBM公司的PCM计算机能够告诉您是否有雨
IBM公司已经公布了一种新的内存计算机制:在相变存储器之内完成处理,而无需借助于外部CPU。
传统计算机制要求利用存储器进行数据保存,而其中的数据将被传递至外部处理器进行运算,得出的结果最初再被写入回存储器。这就是最基本的冯-诺依曼计算机架构,而明显可以看到存储器与计算资源之间存在着性能瓶颈。
如果某些计算任务能够在内存之中完成,则这一瓶颈将不复存在,计算速度也将更上一层楼。
不过内存当中并不包含处理器,因此必须利用存储器中的某些组件,具体取决于存储器中容纳的实际数据内容。此外,这种计算能力也将相当原始。
究竟要如何实现?
在本周发表于《自然通讯》杂志上的论文当中,IBM苏黎世研究院的工作人员们表示,可以在相变存储器(简称PCM)器件当中执行部分计算任务--这是因为此类器件在纳米尺度层面拥有丰富且光明的物理应用前景。PCM器件的单元会随OCM材料的内部状态变化而发生电阻降低,而当这些硫族化合物晶体由无定型晶体重新转变为规则晶体后,电阻将再次上升。
这种状态变化可由施加电流的方式实现,而测量单元电阻即可完成对二进制数值的读取。
蓝色巨人指出:"其基本思路在于不再将存储器视为被动的存储实体,而是利用存储器件的物理属性立足数据存储位置精确实现计算。"
关于PCM,IBM方面解释称"在应用电信号时,这些器件的导电电平动态演变将可用于执行计算任务……器件的导电能力根据电流输入变化而发生演变,而计算结果则将被记录在存储器阵列当中。"
研究人员们表示,当对PCM晶体状态或者相位施加足够高的电流(RESET脉冲)时,大部分材料因电流通过产生的热量而熔化; 但当电流停止后,其以淬火形式保持为非晶体状态。非晶体状态材料的量取决于RESET脉冲的幅度与持续时间,且单元之内存在温度变化梯度。
将单元转变为晶体状态的SET脉冲则同样需要升高其温度以实现结晶,但这一温度低于材料本身的熔点。这种具体状态变化方法被称为晶体动态。存储器单元中的非定型物质的量影响其实际导电率。
IBM公司还设计出一种算法,能够利用100万个PCM设备(单元)阵列检测PCM存储器设备之内各基于事件的数据流间的时间相关性,例如检测物联网设备中的信号是否存在。
其中采用的数学方法极度复杂,涉及诸如"非中心协方差矩阵"以及"集体势能"等术语,我们在本篇文章中就不详加论述了。
根据我们的设想,存储器中会进行一些随机分布的二进制计算进程,其中部分相关,部分不相关。这些进程以固定长度的连续间隔中表达为二进制中的1或者0。我们希望了解其中哪些相关而哪些不相关,从而在统计学层面对其加以分析。
每个进程会被分配给单一相变存储器单元。当进程取值为1时,则设置脉冲以施加到对应的PCM设备。选择SET脉冲的幅度或者时长与所有进程的瞬时和正成正比。通过监测存储器件的导电率,我们即可确定其中存在的相关组。
如此一来,我们即可计算各进程间的统计学相关性,并将结果存储在与存储器内数据驻留位置相同的PCM单元当中。
如何使用这项新技术?
研究人员们提出了这项技术的潜在适用场景:处理真实世界中的数据集,例如天气数据。其能够从气象站读取数据并作为一组包含时间序列的进程(值)。如果气象台宣布将在1小时内发生降雨,则赋值为1,否则则赋值为0。
蓝色巨人设计出的PCM计算设备可以通过一组气象站进程值随时间推移的关联情况来判断是否会发生降雨。
他们得出的结论是,通过使用此类PCM计算存储器模块,相较于使用4套最先进的GPU设备,春能够将相关检测任务加速200倍。另外,这套方案还能够将能源消耗率降低两个数量级。
研究人员们宣称,这种纳米级计算与存储共同体将能够实现超高密度、低功耗与大规模并行计算系统。
备注: 此项研究成果由IBM苏黎世研究院的Abu Sebastian、Tomas Tuma、Nikolaos Papandreou、Manuel Le Gallo、Lukas Kull、Thomas Parnell以及Evangelos Eleftheriou共同完成,论文发表在《自然通讯》杂志之上。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。