Kioxia公司开发了一款专为边缘服务器设计的高速闪存驱动器原型,采用串联连接的闪存"珠链"架构,并使用PCIe 6总线接口。
这种边缘服务器主要面向移动边缘计算单元,通过5G或6G蜂窝网络连接物联网设备,并使用AI模型处理输入数据。由于DRAM成本高昂,这些服务器的内存容量有限,因此需要高带宽的闪存来增强DRAM性能。
Kioxia设计了一种提升带宽的新方法,使用分离式"珠链"闪存串联连接,采用差分串行信号传输而非并行信号传输,每个信号可传输2位数据而非1位。该公司构建的原型设备容量为5TB,通过8通道PCIe Gen 6总线向主机服务器处理器传输数据时,数据传输速率可达64 GBps。
相比之下,美光9650 Pro SSD采用PCIe Gen 6 x 4通道连接,容量范围为6.4TB至25.6TB,可提供高达28 GBps的顺序读取带宽和14 GBps的顺序写入带宽,每通道7 GBps。Kioxia的HBF原型在相同PCIe Gen 6总线上使用8个通道,从5TB容量提供高达64 GBps的传输速度,总吞吐量是美光9650 Pro的约2.3倍,但按每通道计算仅高出约14%(8 GBps对比7 GBps)。
Kioxia的高带宽闪存(HBF)采用闪存珠链和控制器串联连接到每个存储板,而非总线连接方式。该公司表示"即使增加闪存(珠链)数量,带宽也不会下降"。每个串联信号传输2位数据通过PAM4(4级脉冲幅度调制)实现,使用四个不同电压级别编码数据,提供四种可能的2位组合:00、01、10和11。PCIe 6也使用PAM4信号传输。
该公司开发了128 Gbps PAM4高速低功耗收发器,原型的64 GBps带宽功耗不到40W。据了解,美光9650 Pro在顺序读取操作期间峰值功耗为25W。
Kioxia表示,通过在接口中应用低幅度信号传输和失真校正/抑制技术,实现了存储珠链与控制器之间4 Gbps的带宽。在顺序数据访问期间,通过控制器预取技术缩短了读取延迟。
Sandisk作为Kioxia的NAND闪存制造合作伙伴,也拥有HBF技术但实现方式不同。Sandisk的HBF是一组堆叠的NAND层,通过连接线(硅通孔或TSV)将每层连接到基础转接单元,然后连接到主机GPU,而非串行连接。
Kioxia正在开发其HBF技术,用于涉及物联网、大数据分析和AI处理的移动边缘服务器。
Q&A
Q1:Kioxia的高带宽闪存技术有什么特点?
A:Kioxia的高带宽闪存(HBF)采用串联"珠链"架构,使用差分串行信号传输,每个信号可传输2位数据。该技术通过PAM4调制实现,即使增加闪存数量也不会降低带宽,5TB容量原型可提供64 GBps传输速度。
Q2:这种新闪存技术相比传统SSD有什么优势?
A:相比美光9650 Pro SSD,Kioxia HBF原型总吞吐量提升约2.3倍,达到64 GBps。虽然按每通道计算仅高出14%,但整体性能显著提升,同时功耗控制在40W以下,适合边缘服务器应用。
Q3:高带宽闪存主要应用在哪些场景?
A:主要面向移动边缘服务器,用于物联网、大数据分析和AI处理。这些服务器通过5G或6G网络连接物联网设备,由于DRAM成本限制内存容量,需要高带宽闪存来增强性能。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。