Kioxia公司开发了一款专为边缘服务器设计的高速闪存驱动器原型,采用串联连接的闪存"珠链"架构,并使用PCIe 6总线接口。
这种边缘服务器主要面向移动边缘计算单元,通过5G或6G蜂窝网络连接物联网设备,并使用AI模型处理输入数据。由于DRAM成本高昂,这些服务器的内存容量有限,因此需要高带宽的闪存来增强DRAM性能。
Kioxia设计了一种提升带宽的新方法,使用分离式"珠链"闪存串联连接,采用差分串行信号传输而非并行信号传输,每个信号可传输2位数据而非1位。该公司构建的原型设备容量为5TB,通过8通道PCIe Gen 6总线向主机服务器处理器传输数据时,数据传输速率可达64 GBps。
相比之下,美光9650 Pro SSD采用PCIe Gen 6 x 4通道连接,容量范围为6.4TB至25.6TB,可提供高达28 GBps的顺序读取带宽和14 GBps的顺序写入带宽,每通道7 GBps。Kioxia的HBF原型在相同PCIe Gen 6总线上使用8个通道,从5TB容量提供高达64 GBps的传输速度,总吞吐量是美光9650 Pro的约2.3倍,但按每通道计算仅高出约14%(8 GBps对比7 GBps)。
Kioxia的高带宽闪存(HBF)采用闪存珠链和控制器串联连接到每个存储板,而非总线连接方式。该公司表示"即使增加闪存(珠链)数量,带宽也不会下降"。每个串联信号传输2位数据通过PAM4(4级脉冲幅度调制)实现,使用四个不同电压级别编码数据,提供四种可能的2位组合:00、01、10和11。PCIe 6也使用PAM4信号传输。
该公司开发了128 Gbps PAM4高速低功耗收发器,原型的64 GBps带宽功耗不到40W。据了解,美光9650 Pro在顺序读取操作期间峰值功耗为25W。
Kioxia表示,通过在接口中应用低幅度信号传输和失真校正/抑制技术,实现了存储珠链与控制器之间4 Gbps的带宽。在顺序数据访问期间,通过控制器预取技术缩短了读取延迟。
Sandisk作为Kioxia的NAND闪存制造合作伙伴,也拥有HBF技术但实现方式不同。Sandisk的HBF是一组堆叠的NAND层,通过连接线(硅通孔或TSV)将每层连接到基础转接单元,然后连接到主机GPU,而非串行连接。
Kioxia正在开发其HBF技术,用于涉及物联网、大数据分析和AI处理的移动边缘服务器。
Q&A
Q1:Kioxia的高带宽闪存技术有什么特点?
A:Kioxia的高带宽闪存(HBF)采用串联"珠链"架构,使用差分串行信号传输,每个信号可传输2位数据。该技术通过PAM4调制实现,即使增加闪存数量也不会降低带宽,5TB容量原型可提供64 GBps传输速度。
Q2:这种新闪存技术相比传统SSD有什么优势?
A:相比美光9650 Pro SSD,Kioxia HBF原型总吞吐量提升约2.3倍,达到64 GBps。虽然按每通道计算仅高出14%,但整体性能显著提升,同时功耗控制在40W以下,适合边缘服务器应用。
Q3:高带宽闪存主要应用在哪些场景?
A:主要面向移动边缘服务器,用于物联网、大数据分析和AI处理。这些服务器通过5G或6G网络连接物联网设备,由于DRAM成本限制内存容量,需要高带宽闪存来增强性能。
好文章,需要你的鼓励
本文探讨如何使用生成式AI和大语言模型作为倾听者,帮助用户表达内心想法。许多主流AI如ChatGPT、Claude等被设计成用户的"最佳伙伴",或试图提供心理健康建议,但有时用户只想要一个尊重的倾听者。文章提供了有效的提示词技巧,指导AI保持中性、尊重的态度,专注于倾听和理解,而非给出建议或判断。同时提醒用户注意隐私保护和AI的局限性。
北京大学团队开发出WoW世界模型,这是首个真正理解物理规律的AI系统。通过200万机器人互动数据训练,WoW不仅能生成逼真视频,更能理解重力、碰撞等物理定律。其创新的SOPHIA框架让AI具备自我纠错能力,在物理理解测试中达到80.16%准确率。该技术将推动智能机器人、视频制作等领域发展,为通用人工智能奠定重要基础。
人工通用智能和超级人工智能的出现,可能会创造出一种全新的外星智能形态。传统AI基于人类智能模式构建,但AGI和ASI一旦存在,可能会选择创造完全不同于人类认知方式的新型智能。这种外星人工智能既可能带来突破性进展,如找到癌症治愈方法,也可能存在未知风险。目前尚不确定这种新智能形态是否会超越人类智能,以及我们是否应该追求这一可能改变人类命运的技术突破。
香港大学和蚂蚁集团联合推出PromptCoT 2.0,这是一种让AI自动生成高质量训练题目的创新方法。通过"概念-思路-题目"的三步策略,AI能像老师备课一样先构思解题思路再出题,大幅提升了题目质量和训练效果。实验显示该方法在数学竞赛和编程任务上都取得了显著提升,为解决AI训练数据稀缺问题提供了新思路。