备份和云存储供应商 Backblaze 发布了其季度硬盘统计报告。
截至去年底,该公司拥有 301,120 个用于存储数据的硬盘。2024 年第四季度各供应商硬盘型号的年度故障率 (AFR) 图表显示,有四款硬盘的故障率明显超过 4.5%。这些异常值包括一款 12TB 的 HGST 型号 (HUH7212ALN604) 和三款 Seagate 硬盘,分别是 10TB (ST10000NM0086)、12TB (ST12000NM0007) 和 14TB (ST14000NM0138) 容量的型号。
所有硬盘的平均故障率为 1.35%。
同时也有表现优异的硬盘,五种型号在本季度实现零故障:一款 4TB 的 HGST (HMS5C4040ALE640)、Seagate 的 8TB (ST8000NM000A)、14TB (ST14000NM000J)、16TB (ST16000NM002J) 和 24TB (ST24000NM002H)。博主 Andy Klein 表示:"24TB 的 Seagate 硬盘与 20TB 的 Toshiba 和 22TB 的 WDC 硬盘型号一起加入了 20TB+ 俱乐部,我们在优化现有存储服务器空间的同时,继续大幅提升存储容量。"
Backblaze 还公布了 2024 全年的故障率数据,我们也对此进行了图表展示。
Seagate 的 12TB (ST12000NM0007) 硬盘在第四季度和 2024 全年统计中都显示出最高的故障率,其 14TB (ST14000NM0138) 和 10TB (ST10000NM0086) 型号以及 HGST 的 12TB (HUH7212ALN604) 在全年故障率统计中表现同样不佳。
Klein 写道:"2024 年没有任何合格的硬盘型号实现零故障。不过,16TB 的 Seagate 型号 (ST16000NM002J) 表现接近,仅在第三季度记录到一次硬盘故障,使该硬盘 2024 年的故障率为 0.22%。"2024 年的平均故障率为 1.57%,优于 2023 年的 1.7%。Klein 预计 2025 年的故障率会更低。
Backblaze 在这一年安装了 53,337 个硬盘,每位技术人员平均每小时安装 26 个。他们追踪了过去几个季度不同容量硬盘的故障率:
10TB 硬盘的故障率最高,其次是 2024 年的 12TB 硬盘和 8TB 硬盘。Klein 表示:"8TB (灰线) 和 12TB (紫线) 硬盘的使用年限在 5-8 年之间,因此它们的整体故障率会随时间增加。"
"14TB (绿线) 和 16TB (天蓝线) 硬盘占在用硬盘的 57%,平均使用年限为 2-4 年。它们正处于最佳工作状态。因此,它们应该具有较低且稳定的故障率,从图表中可以看出确实如此。"
Klein 从另一个角度分析了各供应商的故障率:
HGST 在 2024 年攀升至这个特定榜单的顶端,故障率超过了此前表现最差的 Seagate,Toshiba 排名第二,Western Digital 提供的硬盘可靠性最高。HGST 的糟糕表现主要归因于其 12TB 硬盘。如果将这些硬盘排除在外,HGST 硬盘在 2024 年的故障率将降至 0.55%。
在展示这些独特的硬盘故障率统计数据多年后,Klein 现已退休。这些数据在其他地方都无法获得,我们应该对他的贡献表示衷心的感谢。
用于创建本报告中表格和图表的完整数据集可在 Backblaze 的硬盘测试数据页面上获取。您可以免费下载并将这些数据用于自己的目的,但必须注明 Backblaze 作为数据来源。
好文章,需要你的鼓励
企业谈AI基础设施时,注意力往往首先集中在模型、GPU和算力集群上。但当大模型应用走向规模化推理,一个瓶颈开始浮现:算力采购完成,并不意味着Token能够被稳定、低成本、可控地交付出去。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。