扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共2页)
灾难恢复(DR)是整个存储行业被广泛讨论的一个话题,而本文将探讨这个市场的一个具体部分:大型归档系统的灾难恢复计划。
首先来看看归档系统的定义,它特指保存信息的存储库,但其中大多数信息被访问的频率都很小。
但归档系统的定义最近也发生了变化。三四年前,归档系统一直都保存在磁带上,且只具有少量的磁盘缓存(通常少于总容量的5%)。磁带或磁盘上管理数据的软件被称为分层存储管理(HSM),35年前 HSM技术问世,被用于大型机。
现如今,一般都使用基于磁盘的大型归档系统通过网络来进行数据备份。例如,工作PC和家用PC是通过互联网进行备份,而基于云的大型归档系统也是相当普遍。
笔者对大型归档系统的定义相当简单:任何有超过2000 块SATA硬盘的系统,按照目前容量水平,大约为4 PB,明年随着硬盘容量的增加,其容量将达到8PB。在给定预期故障率的前提下,笔者使用了2000块硬盘作为归档系统大小。即使配置为RAID 6(需要2400块硬盘),在给定恢复时间内为单个应用管理这些硬盘也是很有挑战的。
三种灾难类型
需要考虑三种类型的灾难:单个文件或一组文件的丢失,元数据的损坏以及所谓的设备损坏。
单个文件或一组文件的丢失与设备损坏是两个完全不同的问题。相比彻底的灾难(地震、暴风、雷击、能源激增、洒水器等),单个文件或一组文件的丢失显得更加普遍,也更易发生。通常人们在开发系统时,都会保留至少两个数据备份。对于大型归档系统,发生灾难时考虑到重新复制数据的时间以及存储系统的数据完整性,两个备份可能是不够的。
元数据损坏问题发生的可能性不大,但确实也会发生,而且发生次数比人们预计的要多。元数据损坏可能是文件系统元数据的损坏,或在进行重复数据删除时,如果保护不力,数据块的损坏也将成为灾难。
当然,成本也在数据保护中起到了极大的作用。许多厂商都在谈论四个九、五个九、甚至八个九的可用性和可靠性。但是,当拥有PB级数据的时候,就需要重新思考这个问题。
下面的图表显示了基于几个九的可靠性下预计的数据丢失:
图表显示,在十个九的数据可靠性下,一千万亿字节的数据预计会丢失900720字节。因此,对于大型归档系统来说,几个九的数据可靠性也应该纳入考虑范围。一些数据保护环境是不允许发生数据丢失的,在一个企业从模拟转移到数字时,一些管理人员并不了解,数字媒体上的数据不是百分之百可靠的,拥有多个数字媒体的备份比把书放到书架要花费更多的成本,鉴于此,数据应该迁移到新媒体上,当然,不多做些数据备份,依然不能保证百分之百的可靠性。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者