但截至目前,将存储与计算相融合的技术尚未大范围流行。
NVM Express联盟日前更新规范,希望引入计算存储功能以建立新的标准化方式,在应用程序与包含特定处理功能的存储设备之间建立通信机制。
NVM Express(下文简称「该组织」)负责监督通过主机PCIe总线使用固态硬盘(SSD)的NVMe规范,而新加入的计算存储功能将进一步扩展规范以支持NVMe计算存储设备。
此番支持涵盖两套新的NVMe命令集:其一用于计算程序,其二用于子系统本地内存命令。两套命令集现在均可从NVM Express官方网站处下载。
其中计算程序命令集将使NVMe设备能够对NVM子系统中的数据执行操作,使用各项命令管理设备上的计算活动。
另一方面,子系统本地内存命令则允许通过NVMe I/O命令访问NVM子系统中的本地内存,可通过各项命令实现用户数据读取/写入以及将用户数据复制到设备本地内存等操作。
计算存储技术的核心,在于将计算与存储紧密耦合的新型架构。这种架构的优势,主要在于将处理能力嵌入至SSD等存储设备以减少数据移动需求。如此一来,数据库和AI处理等延迟关键型应用的响应速度将显著提升。
NVMe计算存储任务组联席主席Bill Martin在回应采访的声明中表示,“NVM Express计算存储是我们向企业和超大规模数据中心伸出援手,满足存储行业不断变化的现实需求的重要举措。”Martin本人还担任三星电子负责SSD IO标准的首席工程师。
“计算存储是一种标准化方法,将建立起开放且可互操作的生态系统。通过将计算任务移交至存储设备,我们预计相关行业的总体拥有成本将有所降低、整体性能也将随之提升。”
三星是目前制造计算存储驱动器(产品名称为SmartSSD)的参与厂商之一。
在与英特尔存储软件架构师Kim Malone共同撰写的博文中,Martin解释了数据集规模的增加如何在网络带宽用量、主机内存和CPU利用率等层面引发性能瓶颈。而计算存储技术又如何经由NVMe设备将部分数据处理任务从主机上转移出来,有效解决这个问题。
博文指出,“通过减少计算过程中所需的数据传输量,系统能够为关键数据应用提供更快的响应速度。”
“此外,通过将计算任务转移至NVMe设备,计算存储技术还有助于释放整个系统的架构利用率,降低数据中心环境的总体拥有成本。”
但根据技术媒体Blocks & Files最近的报道,计算存储技术截至目前并未得到市场的广泛接纳。而其中一大原因,就是与系统主机处理器(通常是FPGA或者少量Arm核心)相比,存储设备中嵌入的计算容量太过孱弱。
计算存储SSD的典型应用,往往侧重于承担压缩/解压缩、纠删码以及加速数据库等场景下的键值操作。
目前还不清楚新的NVM Express规范能否或者如何与存储网络行业协会(SNIA)定义的计算存储架构与编程模型相兼容。
不到一年之前,SNIA刚刚发布上述规范的1.0版本。文件定义了相关概念,旨在为应用程序提供通用编程模型,用以发现并使用附加至计算机系统的一切计算存储资源。
好文章,需要你的鼓励
在Meta Connect大会上,Meta展示了新一代Ray-Ban智能眼镜的硬件实力,配备神经腕带支持手势控制,电池续航翻倍,摄像头性能提升。然而AI演示却频频失败,包括Live AI烹饪指导、WhatsApp通话和实时翻译功能都出现问题。尽管Meta在智能眼镜硬件方面表现出色,但AI软件仍远未达到扎克伯格提出的"超级智能"目标。文章建议Meta考虑开放AI生态,允许用户选择其他AI服务商,这可能帮助Meta在AI硬件市场获得优势。
DeepSeek-AI团队通过强化学习技术开发出DeepSeek-R1系列推理模型,无需人工标注即可自主学习复杂推理。该模型在数学、编程等领域表现卓越,在AIME 2024中达到79.8%准确率,编程能力超越96%人类选手。研究团队还通过知识蒸馏技术将推理能力传递给小模型,使7B参数模型也能超越GPT-4o。这项突破为AI推理能力发展开辟新路径。
英伟达同意以50亿美元收购英特尔股份,双方将合作开发多代数据中心和PC产品。英伟达将以每股23.28美元的价格收购约4%的英特尔股份,成为其最大股东之一。两家公司将通过NVLink接口整合各自架构,实现CPU和GPU间的高速数据传输。英特尔将为英伟达AI平台定制x86处理器,并开发集成RTX GPU的x86系统级芯片,用于消费级PC市场。
微软研究院推出rStar-Math系统,通过创新的"深度思考"训练方法,让小型AI模型在数学推理能力上达到甚至超越OpenAI o1水平。该系统采用代码验证、过程偏好模型和四轮自进化训练,将70亿参数模型的数学能力从58.8%提升至90.0%,在美国数学奥林匹克竞赛中达到前20%水平,证明了精巧方法比模型规模更重要,为AI发展开辟了新路径。