科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网存储频道论:混合硬盘、缓存SSD及其现实意义

论:混合硬盘、缓存SSD及其现实意义

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

在存储系统前端设置缓存以改善性能表现的概念再次席卷而来。我记得上一次听说这个概念还是在本世纪初,可惜当时遭遇了悲剧性的失败。没错,这种机制确实能在某些应用领域发挥作用,但在大多数情况下,它无法与通用存储方案顺利协作。

来源:ZDNet存储频道(编译) 2013年4月29日

关键字: 混合硬盘 SSD

  • 评论
  • 分享微博
  • 分享邮件

在本页阅读全文(共2页)

你要处理的是读取、写入、既读取又写入还是先写入后读取?

数据的访问方式是什么?缓存的设计初衷是帮助我们更好地重复使用数据。如果大家不需要重复使用数据,并且执行持续写入动作,那么缓存系统其实并不清楚这些写入内容根本不会被读取。缓存系统甚至无法理解究竟是哪部分数据有可能被读取。只有确定了将被使用的对应数据,缓存才能顺利发挥作用;然而除非这部分数据被再次读取,否则无论是DDR还是包含通用存储控制器或RAID卡的NAND闪存都无法提供有价值的性能提升。

文件到底有多大?

如果大家的文件比缓存容量还大,那么这套缓存机制很可能会形同虚设。文件大小在缓存使用中影响巨大,请大家务必注意。

你以何种方式访问这个(些)文件?

数据会被重复使用吗?要回答这个问题,了解数据的访问模式至关重要。如果我们拥有1TB缓存空间、50TB文件总量并且只使用800GB文件数据,那么缓存的提速效果将相当明显。然而如果将常用数据集设定为5TB,那么缓存机制的效果将大打折扣。

有多少人使用这套文件系统?

这样的情况我见过很多次,缓存的辅助效果根据用户数量上下浮动——人少时作用拔群、人多时则毫无存在感。大家需要把这一点也考虑进来。

工具

要想了解自己到底需要多大的缓存,我们需要利用工具来进行准确测算、而不能像蒙着眼睛扔飞镖那样误打误撞。然而工具却也是整个过程中最难搞定的大问题。

我曾见过很多来自供应商的此类工具突然出现又凭空消失。由于开放系统的容量管理并没有——或者说从来没有——得到足够的重视,许多人偏向于盲目购买更多硬件。毕竟这样比理清问题头绪的成本要低。

目前最大的阻碍在于存储空间设定根本没有经过严格计算,管理者往往热衷于采购更多在某些情况下根本用不上的存储硬件。哦,也许某些财大气粗的家伙会把全闪存系统当成问题的下一个答案,但至少目前来说这样的计划还是太过奢侈了。我希望大家能把一部分预算花在购买工具上,而不是无脑堆硬件——我想我可能还是太幼稚了。

技术权衡

根据各家磁盘驱动器厂商发展路线的不同,情况也变得越来越有趣。目前混合型磁盘驱动方案一般会为每个驱动器搭配8GB左右的缓存,但目前这些产品还都不属于企业级设备。我认为在众多公告与市场压力的双重推动下,未来几个季度内情况会有所改变。

比如说大家拥有一套包含一百块4TB驱动器的文件系统,其中每块驱动器拥有16GB闪存缓存。这就意味着我们的总体闪存缓存容量为1600GB或者说1.6TB,而存储空间总量则为400TB。让我们假设大家使用的是RAID-6,这会减少20%的实际存储空间,因此最终可用空间为320TB,而闪存缓存则为1.2TB。现在,如果我们假设驱动器供应商使用的算法与缓存供应商基本相同,那么这320GB存储空间与1.28TB闪存缓存能给用户带来320 x 120MB每秒的闪存写入、读取带宽。计算下来,闪存的总体带宽将达到37.5GB/s。

认真想想:这样的速度相当于23条1600MB/s的光纤通道连接或者25条12Gb/s SAS连接(或者50条6Gb/s SAS连接)传输能力的总和。相信大家已经明白其中的意义了。

挑战

我认为目前的难题在于,这些SSD闪存缓存在传输带宽方面会被混合型磁盘驱动器远远甩在身后——除非大家愿意投入大笔资金为这些外部缓存设备提供额外的带宽连接。

在我看来,磁盘驱动器制造商已经意识到这种状况,而且外部缓存市场的存在也只是昙花一现。这并不是说大家不该购买这类技术,毕竟缓存的介入能让应用程序与用户双双获益。我希望强调的是,在未来几年中外部缓存设备将逐渐被缓存磁盘驱动器所取代——当然,前提是市场需求与我的预期相符。但请记住,原先我也做出过错误判断,所以这一结论仅供参考。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章