扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共2页)
推荐基于磁盘和磁带的归档系统
笔者建议大型归档系统使用以下数据保护策略和程序。除特别说明,这些建议均适用于基于磁盘归档系统和磁带归档系统。
数据应该实现异地同步复制、验证,且异地应选取在灾难发生区域以外的地方。例如,如果你身处一个经常发生龙卷风的地方,那么复制的地方就应选取在距本地100英里(500英里更好)以南或以北的区域,因为龙卷风一般是向东或向西行。
利用额外的ECC或可用校验来验证数据。大多数HSM系统在磁带上都具有每个文件的可用校验,但磁盘上不具备。针对磁带和硬盘的T10 DIF/PI技术在今年将会投入使用,许多厂商也在研发端到端的数据完整性技术。校验每个文件也开始成为文件系统社区关注的一部分,但校验并不能改正数据,它只能报错。如果想知道文件中错误的具体位置,就需要在文件中加入ECC,以查看、改正错误。
对于基于磁盘的归档系统,所有的RAID设备应该启用“读取奇偶校验检查”。一些RAID阵列支持这一功能,但其他的不支持。而且部分支持此功能的RAID阵列会导致性能下降。如果存储系统的故障问题导致校验失败,“读取奇偶校验检查”功能将在每个文件校验的基础上提供另一个水平的完整性。它可确保在整个文件全部丢失之前发现RAID控制器中块文件的错误。
对于基于磁带的归档系统,需要指出的是,数据不是直接移动到磁带上,而是先到磁盘,然后再通过HSM到达磁带。RAID设备应该启用奇偶校验检查。
确保对硬盘的各个方面进行软件和硬盘的误码监视。软件误码最终将转变为硬盘误码,更有可能导致文件丢失。软件误码应该在它们转变为硬件误码之前得到迅速的解决。这对于磁盘来说是一个应该注意的问题,因为其中没有自我监控、分析和检查的技术(SMART)。
如有可能的话,定期维护和备份文件系统的元数据,以及磁带中数据的HSM元数据。因为在发生故障的时候,元数据可以在没有恢复所有数据的情况下得到修复。如果文件系统中元数据和数据是分离的,这项工作将更加容易实现。
定期验证每个文件的校验。对于大型档案,考虑到CPU、内存和I/O带宽的需求,这将成为一个重大的架构问题。
基于硬盘和基于磁带归档系统的灾难恢复计划是相似的。一些技术可能不同,但关键在于定期的检查和为将会出现的灾难作准备。太多的企业不适当投资大型归档系统,同时还不希望发生数据丢失。如果拥有一个50PB的归档系统和一个复制站点,而且因为灾难而丢失了整个归档,当重新复制站点时,肯定也会丢失数据。没有任何办法可以避免媒体的硬件误码。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者