至顶网›存储频道 ›为大型归档量身打造DR计划

为大型归档量身打造DR计划

扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条

灾难恢复（DR）是整个存储行业被广泛讨论的一个话题，而本文将探讨这个市场的一个具体部分：大型归档系统的灾难恢复计划。

作者：存储时代（编译）来源：Stor-age.com 2011年2月17日

关键字：灾难恢复 RAID 归档磁带

在本页阅读全文(共2页)

推荐基于磁盘和磁带的归档系统

笔者建议大型归档系统使用以下数据保护策略和程序。除特别说明，这些建议均适用于基于磁盘归档系统和磁带归档系统。

数据应该实现异地同步复制、验证，且异地应选取在灾难发生区域以外的地方。例如，如果你身处一个经常发生龙卷风的地方，那么复制的地方就应选取在距本地100英里（500英里更好）以南或以北的区域，因为龙卷风一般是向东或向西行。

利用额外的ECC或可用校验来验证数据。大多数HSM系统在磁带上都具有每个文件的可用校验，但磁盘上不具备。针对磁带和硬盘的T10 DIF/PI技术在今年将会投入使用，许多厂商也在研发端到端的数据完整性技术。校验每个文件也开始成为文件系统社区关注的一部分，但校验并不能改正数据，它只能报错。如果想知道文件中错误的具体位置，就需要在文件中加入ECC，以查看、改正错误。

对于基于磁盘的归档系统，所有的RAID设备应该启用“读取奇偶校验检查”。一些RAID阵列支持这一功能，但其他的不支持。而且部分支持此功能的RAID阵列会导致性能下降。如果存储系统的故障问题导致校验失败，“读取奇偶校验检查”功能将在每个文件校验的基础上提供另一个水平的完整性。它可确保在整个文件全部丢失之前发现RAID控制器中块文件的错误。

对于基于磁带的归档系统，需要指出的是，数据不是直接移动到磁带上，而是先到磁盘，然后再通过HSM到达磁带。RAID设备应该启用奇偶校验检查。

确保对硬盘的各个方面进行软件和硬盘的误码监视。软件误码最终将转变为硬盘误码，更有可能导致文件丢失。软件误码应该在它们转变为硬件误码之前得到迅速的解决。这对于磁盘来说是一个应该注意的问题，因为其中没有自我监控、分析和检查的技术（SMART）。

如有可能的话，定期维护和备份文件系统的元数据，以及磁带中数据的HSM元数据。因为在发生故障的时候，元数据可以在没有恢复所有数据的情况下得到修复。如果文件系统中元数据和数据是分离的，这项工作将更加容易实现。

定期验证每个文件的校验。对于大型档案，考虑到CPU、内存和I/O带宽的需求，这将成为一个重大的架构问题。

基于硬盘和基于磁带归档系统的灾难恢复计划是相似的。一些技术可能不同，但关键在于定期的检查和为将会出现的灾难作准备。太多的企业不适当投资大型归档系统，同时还不希望发生数据丢失。如果拥有一个50PB的归档系统和一个复制站点，而且因为灾难而丢失了整个归档，当重新复制站点时，肯定也会丢失数据。没有任何办法可以避免媒体的硬件误码。

VIP专区

VIP用户

普通用户

邮件订阅

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一。

重磅专题

往期文章

为大型归档量身打造DR计划

业界热点: