关于四级单元闪存纠错问题的潜在解决方法。
与此前的平面NAND相比,3D NAND技术的运用将使得错误检查代码更易于实现,这也进一步确定了容量提升的四级单元技术的可行性。
错误检查代码(ECC)技术的使用范围包括通过采用算法以计算为存储数据添加冗余所需添加与使用的位数,在固定大小区域内工作的分组代码与Reed-Solomon编码即是此类技术的应用实例。并且与该技术能够完成的纠错量相比,其可检测到的错误数量更多。
低密度奇偶校验(LDPC)编码是ECC技术的一种较新版本。BCH(Bose-Chaudhuri-Hocquenghem)编码则是另一项纠错技术,这种二进制BCH编码可被设计用于多位数纠错。通常而言,客户希望能够完成的纠错位数越多,则需要添加到数据中的冗余ECC位数就越多。
由于读取单元无法提供明确的1或0,因此在这种情况下,一个或多个字节的值可能会因错误而失真,所以NAND闪存需要配有ECC。
而ECC编码则能够检测并纠正以上所提及的错误。
随着NAND读取难度的增加,需要添加的ECC位数与ECC算法的复杂程度也随之提高。其中,“读取难度”一种概括性说法,其具体是指单元可读性随着单元尺寸与其所存储的位数增加而降低。
举例而言,小单元之间可能存在跨区效应,具体表现为一个单元内的设置值可能会对相邻单元内的设置造成一定影响。而其中所涉及的设置值还包括电子——其数量与稳定性会随着单元尺寸缩小而降低。
因此,与SLC(一级单元)相比,MLC(二级单元)与TLC(三级单元)闪存的读取固然会更困难。当然,尽管QLC(四级单元)在技术上已具有一定可行性,但由于单元可读性以及ECC编码与算法仍是亟待解决的两大难题,所以直到现在QLC还尚未具备实用性。
SanDisk公司曾于2009年试图采用43纳米几何平面结构实现QLC NAND的生产,但在经历了一年左右的研究后即选择了放弃。
同样,与25纳米单元以及35纳米单元相比,20纳米的MLC闪存单元更难实现读取。此外,16纳米的MLC闪存单元则是很难实现再次读取,而在此级别上所采用的ECC已经实现了BCH与LDPC ECC技术的融合。
根据Objective Analysis公司的Jim Handy简要报告可知,选择采用3D NAND将会让这些难题简化。
其中的两大主要原因如下:
首先,当3D NAND闪存芯片建成之后,单元尺寸将从15纳米恢复至40纳米左右,尔后即可在该芯片上采用最先进的2D或平面NAND技术。
其次则是源于3D NAND的构建方式。“3D NAND的浮栅或电荷捕获将在作为通道的接杆附近形成一个圆圈,从而让其面积增加了三倍以上。故而现在3D NAND芯片的面积大致相当于一款90纳米的平面NAND芯片。”
另外,Jim Handy还提供了一张图表以展示MLC与TLC闪存在不同单元尺寸条件下通常所需的ECC位数。
根据图表显示,TLC NAND闪存的单元尺寸在15纳米工艺几何尺寸时所需ECC位数已超过75比特,而当芯片的几何尺寸为90纳米时,ECC的位数需求则在15以下。
对此,Handy在其报告中写道:“我们据此即可推断QLC 3D NAND所需的位数将少于20。这也是为何与以往的平面NAND相比,采用3D NAND能够提升QLC可行性的原因。”
此外,Handy还描绘了每单元拥有更多位数的前景。“从长远看来,我认为大多数3D NAND控制器将会采用LDPC以确保每单元存储4字节以上的数据。当然,实现这一目标需要一些时间。而在短期内,3D NAND将能够通过使用简单的BCH算法完成其向QLC转变。”
试想每单元能够存储5比特字节的闪存——或称之为五级单元或PLC闪存?由于QLC已经用于代表四级单元闪存,所以我们不能将五级单元按quintuple level cell首字母缩写命名,并且其将比QLC闪存增加25%,每单元存储为5比特而非4比特。因此,一款容量为1 TB的QLC SSD或将可能变为1.25 TB的PLC SSD。恩,此番前景的确令人欣喜,但或许仍需数年才能得以实现。
目前看来,QLC闪存似乎已具备一定的可行性,我们或将于今年年底便可见其真身。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。