硬盘选型:硬盘规格说明大问题

Brian Beach曾发表了一篇关于硬盘选型的文章,但是Henry Newman认为,Beach的这篇文章有诸多漏洞,于是撰文批判,并针对硬盘选型发表了自己的观点。小编翻译了Henry Newman文章,以飨读者。

笔者声明:笔者没有购买希捷、WD或者东芝的股票,也没有家人或者亲密的朋友在这三家公司就职。鉴于笔者的咨询师身份,也没有购买磁盘存储。笔者确实认识这些公司的人,但是没有得到任何免费产品。

从Beach文章中的第二个表格开始吧,笔者在原来的表格中加入了另外的四项内容。绿色标注即笔者后加上的项目。

 

首先,看一下发布日期这一项。表中提到的这些硬盘,最早发布的是2006年希捷的Barracuda 1.5 TB硬盘。该盘已经发行8年了!自该硬盘被广泛接受以后,它畅销了五年,没有比它更老的硬盘了。对于该硬盘的系统卡死问题,希捷也公开承认了,所以这款硬盘最后消失也是可以理解的。

我们知道,新硬盘有致命的缺陷,硬盘供应商会谈论这个问题,整个行业也会谈论这个问题,RAID供应商也会提到这个问题,但是提及这个问题没有一个单一的说法。总之,这里存在一系列的问题。

下面就看一下误码率这一项。消费级硬盘和企业级硬盘最明显的区别之一是,消费级硬盘的误码率是1 bit in 10E14 bits,而企业级硬盘的误码率是1 bit in 10E15 bits。下表显示了硬盘的最大擦写量,也就是说当硬盘擦写量超过下表中的值时,将会把硬盘换掉。

 

Beach 在其博文开始就写到:如下表所示,截止到2013年底,Backblaze Storage有27,134款消费级硬盘。

 

笔者注意到,针对希捷1.5TB硬盘,其自发布以来已经有8年的时间了,但是希捷硬盘使用的平均年限是1.4年。鉴于此,平均使用年限就变得没有意义了。而且,如果希捷的硬盘这么差劲,为什么还要购买这么多希捷硬盘?这还不是最大的问题。博文中也没有提到要写入多少数据才会导致硬盘故障。如果有的硬盘使用年限超过厂商限定年限故障,而有的硬盘没有超过厂商限定的擦写量而正常运行,针对这两种情况,该如何比较?

所以说,笔者认为,在I/O次数不同的情况下,是不可以讨论硬盘性能的。

另外,博文还有一个有意思的地方,博文声称希捷Barracuda Green ST1500DL003硬盘故障率是120%。这个120%是如何得到的呢?当硬盘故障率达到100%的时候,再换上新的硬盘,故障率是20%,然后这两个故障率相加得出的吗?或者是博文中提到的“西数的Green 3TB和希捷的LP (low power) 2TB硬盘在我们的测试环境中不能运行。这两款硬盘运行不久就开始出现错误。我们认为这是由于震动造成的。这两款硬盘在新的震动很小的Backblaze Storage Pod中运行会稍微好一点,但是也没有显著改善。”

硬盘说明书中特别说明此款硬盘不适合在震动较大的环境中使用。得出以上结论是否就表明Backblaze的工程师们就没有仔细阅读过硬盘说明书?

下一列是供应商公布的AFR(年故障率),希捷公布了大多数硬盘的AFR,西数只公布了一款硬盘的AFR。

希捷没有公布ST4000DM00的AFR值。希捷在其手册中写到:平均故障率<55TB/年。MTBF规格,工作负载超过平均值将会降低硬盘的MTBF值,并且影响产品的可靠性。平均年工作负载率是 或者TB每8760工作时长。工作负载率限定=转移TB× (8760/工作时长)。

所以,除了震动、操作温度和其他规格以外,以后供应商将会写明硬盘一年的1/O数。

最后,看最后一列。这是硬盘磁头载入载出值,硬盘停止运行的时候给予磁头最大限度地保护。该项目对硬盘可靠性的影响很小,除非其值超出规格说明。此篇博文也没有讨论这个问题。

硬盘研究并不是为了得到硬盘参数的平均值,通过原始数据做一些基础研究是非常有必要的。所以,用户需要知道:

1.硬盘的使用年限,会影响硬盘的故障率。

2.硬盘是否破损,也是会影响硬盘故障率的。

3.硬盘具有擦写次数限制,超过这个限制,硬盘也会出现故障。

4.磁头载入载出次数超过规格说明,也会引起硬盘故障。

5. 平均使用年限不能说明任何问题。

6. SMART数据统计超出限定值,也会导致硬盘故障。

7.震动、温度和其他环境因素都会影响到硬盘的性能。

用户必须了解硬盘各项规格,这些规格将会影响硬盘的使用。笔者将在下一篇文章中讨论如何根据自己的应用需求选择一款合适的硬盘。

来源:watchstor

0赞

好文章,需要你的鼓励

2014

05/07

10:20

分享

点赞

邮件订阅
白皮书