软件RAID供应商Xinnor宣称其产品能在仅仅五小时多一点的时间内重建一个61.44 TB的SSD,速度约为传统Linux RAID重建软件的10倍。
Xinnor的xiRAID产品将数据分布在驱动器集群中。每个驱动器上都有备用区域,故障驱动器的数据会恢复到这些区域,从而减少整体重建时间。Solidigm是SK hynix的子公司,提供大容量SSD,如使用QLC(4位/单元)闪存构建的D5-P5336 61.44 TB产品。Xinnor和Solidigm联合发布的研究报告《使用xiRAID加速RAID重建并减少Solidigm QLC高密度驱动器的写入放大》显示,在没有主机工作负载的情况下,xiRAID可以在5小时22分钟内重建故障驱动器,而mdraid(Linux软件RAID)则需要53小时40分钟。
Xinnor首席营收官Davide Villa表示:"我们与Solidigm的合作证明,高密度QLC驱动器搭配优化的软件RAID可以提供组织所需的容量、性能和可靠性,消除了由于长时间重建而在降级模式下运行的挑战。"
Xinnor和Solidigm的研究使用了配备Intel Xeon Gold 6430处理器和10个Solidigm D5-P5336 61.44 TB驱动器(RAID 5配置)的Dell PowerEdge R760系统。研究测量了各种条件下的重建性能和写入放大。
在活跃工作负载下,xiRAID软件保持316 MBps的重建速度,而mdraid仅为10.5 MBps,同时xiRAID在重建过程中实现了1.02的写入放大因子(WAF),而mdraid为1.2。WAF指的是SSD控制器响应主机写入而执行的额外NAND介质写入操作(WAF = 总NAND介质写入 / 总主机发出的写入),这是由于SSD的块组织结构所致。较低的WAF可延长SSD的工作寿命(耐久性)。
在有持续主机工作负载的情况下重建时,使用xiRAID重建Solidigm 61.44 TB SSD的速度约为使用Linux mdraid软件的30倍,且WAF低23%。根据Xinnor博客:"如果没有Solidigm D5-P5336 QLC SSD的原始性能能力,重建可能需要很长时间——在某些情况下长达数月——且/或主机IO将无法得到适当服务。"
Xinnor表示,xiRAID在重建操作期间提供44 GBps的读取和13 GBps的写入性能。研究指出,"虽然mdraid在主机工作负载下重建61.44 TB驱动器需要超过67天,但xiRAID在保持强大的主机应用程序性能的同时,大约54小时内就能完成相同操作。"
可以从Xinnor或Solidigm获取该研究的副本。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。