科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网存储频道存储的那些“坑”

存储的那些“坑”

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

一块硬盘就是一个小火炉,SSD更是大火炉,这一堆堆的硬盘和SSD摞在一起,就是一座火焰山。硬盘和SSD在使用时,对环境温度又有严格的要求,制冷跟不上,别说7×24,24小时你都过不去。

来源:ZD至顶网存储频道 2016年8月25日

关键字: 存储性能 SSD 硬盘

  • 评论
  • 分享微博
  • 分享邮件

我在一家电视台工作,接触存储设备的时间也不短了,当看到这个灾备大师活动,我也有一些话要讲。首先声明我并不是什么"大师",只是想谈一下我对所接触到的存储设备的一些感受。有些工作场景,由于工作关系不好深入去讲,只想简单去谈谈一些存储中遇到的问题。

基础设施--制冷

首先讲一个我所遇到最严重的故障。那还是在很久以前,有多久,用一句讲来形容的话就是,那时候苹果还只是人们口中的一种水果。当时我们正在尝试数字化转型,新上了一套大品牌的存储设备。可没想到刚一加电试用,还不到24小时,就开始报硬盘故障。赶紧跑去进行处理,故障盘拔下来后第一个感觉是"烫""火烫"!怎么会这样?设备刚刚开始启用,里面仅有些试验性的数据,按道理不应该出这种情况。可是硬盘为什么忽然就报废了呢?分析了半天找到了一个另人哭笑不得的原因,大楼中央空调晚上停止制冷,导致存储使用温度过高,引发硬盘故障。这个教训一直到现在都让我记忆犹新。

确实,一块硬盘就是一个小火炉,SSD更是大火炉,这一堆堆的硬盘和SSD摞在一起,就是一座火焰山。硬盘和SSD在使用时,对环境温度又有严格的要求,制冷跟不上,别说7×24,24小时你都过不去。

所以现如今,数据中心机房建设时,首先要考虑的就是如何进风除尘,以及冷热风道的隔离问题,在保障制冷的同时,减少能耗。

存储的那些“坑”

驱动程序

这个问题到是新近遇到的。开源存储火爆,我们为了响应形式,也开始对开源存储进行试验性的搭建。没想到重重的磨难从此就开始了。

首先遇到的问题就是驱动。由于是试验性质,当时利用了一套不算很新的服务器硬件平台,系统装好后,怎么也加载不上硬盘,RAID卡驱动程序不兼容。想尽办法终于将兼容性问题解决后,又发现存储的IO性能使终上不去,这样一个空有其表的系统,在实验室里装装样子还可以,要是在真实场景中大规模进行应用,肯定会出现问题。

为什么会这样,我向一个常年做网络测试的朋友请教,他给我讲了一个网卡优化故事:

以前国内已经有一些技术先驱者看到了x86在网络应用处理方面的优势所在。但那个时候网络底层数据包处理还需要借助asic、FPGA等硬件加速手段才可以进行高性能数据包转发。

一般企业不具备这样的硬件研发实力,于是他们将脑筋动到了Intel网卡身上,硬件做不了我就改软件,通过对网卡驱动程序的优化,提升了网卡数据包转发处理能力,从而满足了高性能网络应用流量分析的需求。

想当年,国内一个P打头的流控自主创业厂商,被某个现在号称"学无止境"的老兄介绍过来,借用他们测试仪表对他们产品进行测试,一起聊天时他们说为了打开市场,他们这套东西完全免费提供给大家进行试用。这时有一个目前已经得到"大师"称号的家伙在旁边说,那你改写的网卡驱动程序,是不是也能拿出来给我们看一下?没想到这位创业者,双手紧抱着他的笔记本说,这个不行。

通过这件事情,他告拆我,在存储方面也是同一个道理。不是一个随便一个RAID卡加上个驱动就可以进行大规模企业级应用的。底层驱动方面的优化,直接反映出这个厂商核心技术实力,这个东西你如果想通过开源的办法得到,请自行脑补一下那个自由创业者的动作和表情吧……

存储的那些“坑”

管理控制、应用处理

以下纯属他人吐槽,如有雷同,实属巧合:

存储的管理控制,这个了解OpenStack的同学会说,这些OpenStack里面已经都提供了,是的没错,Linux里还已经集成了Ceph了呢。可是你做的规模能有多大?可以保障多大容量的管理不出问题?有太多的问题是在规模上升之后才得以显现的。难道要等到那时候才去说真没想到会是这样吗?是不是因为在我们国家,买教训、交学费已经是一件很常见的事情了,反正不用追责,买个教训无所谓嘛……

可以做多大规模的测试,推多大规模产品,如果一个产品连最基本的测试规模、测试指标都无法提供,就在那里把自己的产品讲的天花乱坠。劝诸位,还是直接把它扔到一边去的好。

当前在进行大规模网络应用性能测试时,往往无法对存储设备的真实性能进行了解。这是因为只要系统的内存够大,对系统的应用数据请求,会在第一次数据读取后,就被系统内存给缓存住,以后同样数据的读取就无需再次对存储系统进行读取。因此对存储系统的测试时,大部分还是利用Iometer,现在Linux底下好像还有用DD、Fio等工具进行测试的。

但总觉得这里有些问题,IO处理虽然是判断存储性能的一个非常重要指标,但这个指标仅相当于网络性能中二层吞吐量的测试指标,而且当然对存储产品测试中,通常还只是利用有限的几个work在4K等块大小时测试存储性能。

在实际的云计算应用场景中,一个节点要建立30-40台虚机、一个数据中心至少要上百个节点,这样的应用规模,存储的处理能力是否能抗得住?一旦出现问题,可不是做几个副本,异地再建个分中心就能解决的了。你的7×24还是一样乘不起来。

还是那句话,可以做多大规模的测试,推多大规模产品。因此,在了解存储产品时,不但要看厂商给的存储性能指标,还要再多问一下是在什么环境下进行的测试。

存储的那些“坑”

开源可以改变世界 但未必能改变你

最后再吐槽一下开源,开源确实是一件好事情,有很多创业公司借助开源技术迅速补齐了产品技术上的短板。也使得当前云计算的技术理念呈现出百家争鸣的热闹景象。存储行业也是如此。也有很多国际知名的大厂商在积极参与到开源工作中去,为之贡献出众多开源代码。

但是,对待开源产品还是应当谨慎。实在想不明白,一些研发门口保安站岗、机箱加铁壳子,USB口贴胶条生怕一行代码流出的厂商,就是为了最后把写好的代码无偿甚至倒贴钱的贡献出去?这实在是太不科学了吧……

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章