在上周召开的Pure Accelerate大会上,这家新兴存储企业谈到如何向其NVMe访问型存储机架当中引入智能化要素。
Pure公司的全闪存阵列拥有一套双控制器设计,这两套控制器负责与非智能存储机架进行通信。这一思路的主要核心在于立足机架层级实现控制器智能,其中NVMe架构则负责将上层控制器智能与下层机架智能进行结合。
如此一来,存储机架即可处理驱动器上的操作,减轻这部分任务给上层控制器带来的负担,并允许机架本身完成更多常见操作任务--例如对接向上扩展规模更为可观的阵列。
这亦可能意味着两套控制器能够运行更多上层服务,例如文件系统等。此外,厂商甚至会考虑进一步增加控制器的实际数量。
作为一家同样计划推动NVMe架构技术的全闪存阵列供应商,Kaminario公司据称也在考虑以类似的方式将智能化要素引入存储阵列当中。
东芝与闪存工艺
东芝公司在本届Pure Accelerate大会上展示了其3D NAND发展路线图。根据尼古拉斯公司分析师兼总经理Aaron Rakers的说明,东芝方面谈到将堆叠层数提升至200左右。
目前东芝公司及其代工合作伙伴西部数据正凭借其BiCS技术打造64层3D NAND,并由此构建起一款512 Gb芯片。将层数提升三倍至192层,则意味着能够带来一款1.536 Tb晶片。如果双方再将存储单元尺寸加以进一步缩减,那么容量水平还将达到新的高度。
东芝公司的XG5 NVMe M.2驱动器采用这款芯片,并在其NVMe M.2版本当中分别提供256 GB、512 GB与1 TB容量选项。西部数据公司的蓝盘SSD同样使用此款芯片,并将容量提升至2 TB级别。
如果将该芯片的容量提升三倍,即由512 Gb到1.5 Tb,则意味着XG5技术在容量上可增长至3 TB,而西部数据的蓝盘SSD则将增长至6 TB。
东芝方面还谈到其四层单元(即QLC)技术,并表示QLC 3D NAND芯片即将来临。我们再据此进行计算--目前的XG5与西部数据蓝盘驱动器采用TLC(即三层单元),如果将其变更为QLC驱动器,则容量还能够提升三分之一。
如此一来,一款QLC、192层XG5将拥有4 TB容量,同样的西部数据蓝盘SSD则将拥有8 TB容量。这些QLC驱动器的写入寿命将较为低下,因此只适用于所谓主动访问归档类应用。
再回到Pure公司--假定Pure公司也会在其阵列当中采用NVMe架构与QLC闪存这一组合,那么也许将由此诞生出一款主动归档FlashBlade阵列方案。
好文章,需要你的鼓励
这项研究介绍了一种名为FlowPathAgent的神经符号代理系统,用于解决流程图归因问题。研究团队提出了流程图精细归因这一新任务,构建了FlowExplainBench评估基准,并开发了结合视觉分割、符号图构建和基于代理的图形推理的方法。实验表明,该方法在归因准确性上比现有基线提高了10-14%,特别在处理复杂流程图时表现出色,为提升人工智能系统在处理结构化视觉-文本信息时的可靠性和可解释性提供了新途径。
这项研究首次从神经元层面揭示了大型语言模型(LLM)评估中的"数据污染"机制。研究团队发现当模型在训练中接触过测试数据时,会形成特定的"捷径神经元",使模型无需真正理解问题就能给出正确答案。他们提出了一种新方法,通过识别并抑制这些神经元(仅占模型总神经元的约1%),成功恢复了模型的真实能力表现。实验证明,该方法与权威可信基准测试结果高度一致(相关系数>0.95),并在不同基准和参数设置下都表现出色,为解决LLM评估可信度问题提供了低成本且有效的解决方案。
这份来自向量研究所、康奈尔大学和格罗宁根大学研究团队的综述分析了基于大语言模型的代理型多智能体系统中的信任、风险和安全管理框架(TRiSM)。研究系统地探讨了代理型AI从概念基础到安全挑战,提出了包含治理、可解释性、模型运营和隐私/安全四大支柱的TRiSM框架。文章还详细分析了威胁向量、风险分类,并通过真实案例研究展示了潜在脆弱性。
这项研究提出了一种名为ConfiG的创新方法,通过生成针对性的数据增强样本来解决知识蒸馏中的协变量偏移问题。研究团队利用教师模型和学生模型之间的预测差异,引导扩散模型生成那些能挑战学生模型的样本,从而减少模型对训练数据中欺骗性特征的依赖。实验表明,该方法在CelebA、SpuCo Birds和Spurious ImageNet数据集上显著提升了模型在缺失组别上的性能,为资源受限环境下的AI应用提供了实用解决方案。