希捷公司与ZeroPoint Technologies在加利福尼亚州圣何塞举行的OCP全球峰会上,展示了CXL内存层中的硬件加速压缩技术。
作为磁盘驱动器供应商的希捷,如何在计算快速链路(CXL)内存层中利用ZeroPoint的硬件加速内存压缩技术?该公司是否设想在控制器中配备CXL内存层的JBOD机箱,装满Exos磁盘驱动器?
事实证明,希捷正在开发可组合内存设备(CME),并在OCP峰会上举办了多头可组合内存设备下一代会议。据了解,这指的是一个机架式CMA设备,同时连接并支持多个访问端点,使用CXL内存技术。
希捷为其CMA设备开发了可组合结构管理器(CFM),代码可在Github上获得。该管理器"为与可组合内存设备交互提供客户端接口。它为客户端提供北侧(前端)OpenAPI接口,为管理可用的可组合内存设备(CMA)和CXL主机提供南侧(后端)Redfish接口。"
由希捷员工撰写的可组合内存结构管理软件和API架构文档可在OCP网站上获得。该文档"定义了管理基于OCP兼容可组合内存设备支持的可组合内存结构系统所使用的最小API。"CMA是"基于CXL技术的可扩展内存设备。"
文档指出:"内存设备包含多个内存刀片,每个刀片可以单独连接到多个CXL主机服务器。"据了解,CMA充当CXL Type 3内存扩展器,允许连接的服务器通过CXL结构访问共享的可扩展内存资源,而不是仅依赖本地DRAM。
ZeroPoint DenseMem技术用于创建压缩内存层,将容量提升1.85倍至2.25倍,从而降低DRAM成本。
该文档没有指明内存刀片连接的持久存储设备,无论是希捷Nytro固态硬盘还是Exos机械硬盘。我们已向希捷询问相关信息。
ZeroPoint表示,其DenseMem技术"通过透明的内联内存压缩/解压缩,将有效的CXL Type 3设备内存容量提高2-3倍,对延迟和带宽的影响最小。DenseMem作为面积和功耗高效的拖放IP模块提供,可跨最新工艺节点移植。"
换句话说,它被集成到CMA设备控制器芯片中。
DenseMem可以集成到CXL Type 3设备的系统级芯片中,位于CXL控制器和内存控制器逻辑块之间。它提供在CXL Type 3设备内自动实例化的压缩内存层,具有实时压缩/解压缩与压实功能,以及透明内存管理。操作以主内存速度和吞吐量进行。
据我们了解,外部JBOF目前通过NVMe和RDMA向GPU服务器发送数据。通过使用这种CMA技术,希捷JBOF或JBOD可以使用CXL内存池化和共享与其通信,这将具有更低的延迟。通过使用多个CMA设备可以提高带宽。
我们假设,从CMA的持久存储将数据加载到其CXL内存中实际上是缓存,大型项目在驱动器间分片以在此级别提高带宽。
Q&A
Q1:希捷的可组合内存设备(CMA)是什么?
A:CMA是希捷开发的基于CXL技术的可扩展内存设备,它是一个机架式设备,可以同时连接并支持多个访问端点。CMA充当CXL Type 3内存扩展器,允许连接的服务器通过CXL结构访问共享的可扩展内存资源,而不是仅依赖本地DRAM。
Q2:ZeroPoint DenseMem技术有什么作用?
A:DenseMem技术通过透明的内联内存压缩/解压缩,将有效的CXL Type 3设备内存容量提高2-3倍,对延迟和带宽的影响最小。它可以集成到CXL Type 3设备的系统级芯片中,提供实时压缩/解压缩与压实功能,以及透明内存管理。
Q3:CMA技术相比传统JBOF有什么优势?
A:传统的外部JBOF通过NVMe和RDMA向GPU服务器发送数据,而使用CMA技术的希捷JBOF或JBOD可以使用CXL内存池化和共享进行通信,具有更低的延迟。通过使用多个CMA设备还可以提高带宽。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。