扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共2页)
自动存储分层 (AST) 技术主要用来帮助数据中心在最大程度地降低成本和复杂性的同时,从基于闪存的介质性能改善中受益。基于闪存的设备(如基于固态硬盘 [SSD] 控制器的闪存)每秒可完成的随机读取操作数比最快的硬盘驱动器 (HDD) 多 25 到 100 倍,但是要达到这样的性能,每 GB 成本也要高出 15 到 20 倍。HDD 的容量在不断地提高,但在每美元 IOPS 方面,HDD 却没有多少改进。闪存所提供的每美元 IOPS 则要多得多,而且延迟时间更短。
图 1) 不同类型固态介质和旋转介质的随机读取效率对比(以对数刻度表示)。请注意,在每美元 IOPS 方面,不同 HDD 类型之间的差别相对较小。
自动存储分层会尝试识别热数据并将其存储在性能较高的存储介质上,同时将冷数据存储在速度较慢、成本较低的介质上,而不是将整个数据集永久地放置在昂贵的介质上。
为了构建最佳解决方案,NetApp 投入了大量时间和精力来了解 AST 必须解决的问题。
本文包括以下内容:
评价 AST 技术所依据的标准
基于迁移的 AST 方式与基于缓存的 AST 方式
NetApp 虚拟存储层 — 基于缓存的 AST 方式
评价 AST 技术
从 I/O 角度来看,AST 的主要目标是将随机 I/O 尽可能多地转移到高性能介质(闪存)上,以最大程度地减少 HDD 上的随机 I/O 负荷,并减少平均延迟。随机 I/O 和顺序 I/O 之间的区分非常重要,因为对于连续读写,闪存与 HDD 相比性价比优势并不明显(原因在于 HDD 非常适于处理顺序 I/O)。
图 2) 不同类型固态介质和旋转介质的连续吞吐效率对比。
以下几个因素会影响 AST 解决方案实现上述目标的能力:
——数据存储的粒度如何?处理的数据块越小,用于存储数据的系统和 HDD 资源的效率就越高,并且冷数据“跟随”热数据移动并毫无益处地耗用昂贵介质的可能性也越小。
——如何识别热数据以及速度加快了多少?热数据进入闪存的速度越快,错过 I/O 活动中相对短暂的高峰期的可能性就越小,需要的 HDD I/O 就越少,并且平均延迟时间缩短的幅度就越大。
从操作角度来看,还需要考虑以下几个因素:
部署和管理该解决方案的难度如何?如果部署 AST 解决方案需要进行重大的重新配置,或需要大量的监控和管理,那么可能会得不偿失。
该解决方案如何与您使用的其他存储技术(备份、重复数据删除、精简配置等)集成?您一定不希望在部署一个解决方案之后,发现备份不能执行,或者虽然能执行,但却需要大量地移动数据。
实现 AST 的两种不同方式:迁移与缓存
实现 AST 有两种本质上不同的方式:迁移和缓存。
基于迁移的 AST 可自动化数据迁移的流程。当一个数据块被确定为“热”数据时,会将该数据块移至速度较快的介质,当该数据块变“冷”时,会将其移回速度较慢的介质。移入和移出闪存都需要访问 HDD。
基于缓存的 AST 使用广为人知的缓存方式将热数据“提升”到高性能的介质中。由于 HDD 上仍保留有数据的副本,因此当数据变“冷”时,只需将其从缓存中释放即可,而不需要额外的 HDD I/O。
图 3) 基于缓存的自动存储分层与基于迁移的自动存储分层。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。