SK hynix正在三个方向上扩展其NAND技术:速度、容量和带宽,以满足AI数据存储性能和数据量需求。
AIN(AI NAND)是SK hynix的AI NAND战略,包含性能(AIN P)、密度(AIN D)和带宽(AIN B)三个产品开发方向。AIN P驱动器将处理大规模AI推理工作负载产生的大量数据。PB级别的AIN D固态硬盘旨在通过以低功耗和成本存储大量AI数据来替代磁盘驱动器,实现固态硬盘速度和硬盘成本效率的结合。
AIN-B闪存采用高带宽闪存(HBF)概念,将闪存芯片堆叠在中介层上方,中介层将这些并行运行的芯片连接到GPU。这一AIN产品倡议在加利福尼亚州圣何塞举行的"2025年OCP(开放计算项目)全球峰会"上发布。
SK hynix专注于AI推理,并在推理工作流程的不同阶段看到了不同的NAND驱动器需求。
AIN P驱动器设想为PCIe Gen6驱动器,具备5000万IOPS性能,数据访问块为512B,相比之下,当前用于随机读写IOPS的4KB块在PCIe gen 6固态硬盘上运行约700万IOPS级别。据SK hynix幻灯片显示,美光的9650 Pro和Max PCIe Gen 6驱动器的随机读取IOPS为550万。SK hynix的AIN P驱动器将比它们快7倍,公司表示,1亿IOPS型号可能在2027年推出。
AIN P将配备专为执行传统和高IOPS工作负载设计的控制器,采用EDSFF E3.x外形规格构建。SK hynix正在设计AIN P NAND样品,希望在2026年底前准备就绪。
AIN B NAND使用HBF(高带宽闪存)技术。SK hynix表示,AIN B将具有比固态硬盘更高的吞吐量,大致相当于使用类似堆叠芯片概念的高带宽内存(HBM),只是用于DRAM。AIN B产品将具有比HBM更高的容量,大约达到固态硬盘容量水平。AIN B可以增强GPU的有效内存容量,从而避免需要购买/租用更多GPU来获得更多HBM容量,例如存储KV缓存内容。
这种HBF堆叠可以与HBM堆叠共同定位,共享相同的中介层基础。SK hynix和闪迪正在合作推广HBF标准。
AIN D磁盘替代固态硬盘将具有PB级容量,称为近线(NL)固态硬盘。幻灯片文本提到"JEDEC-NLF",其中JEDEC是半导体标准机构,NLF表示近线闪存。目前没有公共JEDEC NLF标准,因此这可能是正在进行的工作。图形没有提到PLC(5位/单元)NAND,因此我们可能暂时假设NL-SSD使用QLC闪存。
SK hynix幻灯片显示其AIN产品系列将如何适配数据中心。这是一个清晰且逻辑性强的图景。
看SK hynix的NAND路线图,似乎其子公司Solidigm并不存在。AIN D高容量企业级固态硬盘似乎独立于Solidigm的高容量QLC固态硬盘技术。实际上,Solidigm凭借其D5-P5336 192L QLC 61.44和122.88 TB驱动器开创了高容量近线级固态硬盘。Solidigm的路线图包括超过2XX层数,以及245 TB QLC固态硬盘,预计在2026年底前出货。
公司表示正在开始量产321层QLC 2 Tb芯片,这是首个使用QLC技术实现超过300层的产品,将在2026年上半年出货。
Q&A
Q1:AIN战略是什么?包含哪些产品方向?
A:AIN(AI NAND)是SK hynix的AI NAND战略,包含三个产品开发方向:性能(AIN P)、密度(AIN D)和带宽(AIN B),分别针对不同的AI数据存储需求。
Q2:AIN P驱动器的性能表现如何?
A:AIN P驱动器设想为PCIe Gen6驱动器,具备5000万IOPS性能,比当前PCIe gen 6固态硬盘快7倍,SK hynix表示1亿IOPS型号可能在2027年推出。
Q3:AIN B技术与传统存储有什么区别?
A:AIN B使用高带宽闪存技术,将闪存芯片堆叠在中介层上连接到GPU,具有比固态硬盘更高的吞吐量,容量约达固态硬盘水平,可以增强GPU的有效内存容量。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。