科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网存储频道评估在线处理和后处理去重的恢复时间

评估在线处理和后处理去重的恢复时间

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

探讨关于重复数据删除技术的文章有很多,但是“不同的方法怎样影响灾难恢复技术恢复数据所用的时间”?本文我们将了解将备份数据从分散站点迁移到集中式站点,再将其迁移到远程站点的整个流程,我们将会按照恢复点目标(RPO)与恢复时间目标(RTO)对以目标为基础的两个主要的重复数据删除架构的影响进行评估。

作者:油菜花 来源:IT专家网 2010年3月9日

关键字: TTR 重复数据删除 备份 网络带宽

  • 评论
  • 分享微博
  • 分享邮件

在本页阅读全文(共3页)

评估人们对TTR认知程度的一些关键的必要因素有哪些?让我们更加深入地认识一下这几个因素:

网络带宽

什么时候和在哪里进行重复数据删除会严重影响备份所需的时间。

在备份环境中,重复数据删除往往会减少10倍到20倍甚至更多的备份工作规模。如果在靠近资源的地方进行重复数据删除,那么重复数据删除的好处可减少一定量的数据,而以前这些数据必须通过LAN/WAN才能实现从备份资源到主站点的传输,例如让更小的更廉价的重复数据删除设备与远程办公室或分支机构(ROBO)的本地备份目标一样进行工作。这个因素能够帮助大大降低带宽和时间需求。这一过程中你会面临的取舍是:备份的同时进行重复数据删除会增加时间的需求,而必须在网络中传输数量明显更少的数据的话又可能会节约大量的时间。网络带宽在这一比较过程中是一个关键的变量。

备份提取性能

备份提取性能是一个很重要的因素,但不是唯一的因素。但是,你往往需要将这过程的周期最短化,在这一过程中使用的应用的性能可能会因备份操作而降低,但是你需要弄清楚重复数据删除设备的备份提取性能以及网络向设备交付数据的最大数据量。只有这样你才会理解这是否与在线处理和后期处理过程中的重复数据删除设备的备份提取性能有关。

图:应该使用一整套的指标来评估在线处理和后期处理的重复数据删除方法,来准确地预测从远程灾难恢复站点恢复数据所需的时间。

同时进行的重复数据删除操作

对于在线重复数据删除设备来说,可能出现的状况是,由于重复数据删除与提取备份数据同时进行,会导致提取速度变慢。如果在物理定律下这可能能够实现,但是你同样可能预见到后期处理重复数据删除设备的性能会同样出现下降,因为后期处理重复数据删除设备往往在进行备份工作的同时对另一个对象进行重复数据删除。

尽管这不是对比的唯一点,但是为了在同一个水平上对在线处理和后期处理进行比较,你需要理解后期处理设备的重复数据删除的性能如何,而不能停止于对备份提取性能的了解,并且你还需要理解同时进行备份提取的时候如何进行转换。在线处理厂商会公开公布重复数据删除性能与备份提取性能的特点,然而后期处理厂商通常仅仅报告备份提取的性能,而不公开重复数据删除的性能。如果要想知道本地备份什么时候完成你不需要知道两种数据点,但是,一旦不能将备份数据传输到远程灾难恢复站点以及你不知道在该远程站点的TTR是多少的话,你就需要弄清楚这两个的性能了,除非这些数据已完成提取和重复数据删除。

更多网络带宽问题

如果在灾难恢复站点你将数据保存在磁盘上,那么重复数据删除性能可能会对TTR产生另一种影响,这种影响可能不是快速并且明显的。需要对受到毁灭性的灾难影响的多个系统进行全面的恢复,诸如此类的特定的恢复操作可能需要人们将大量的数据传输出去,并且这那样的情况下你往往不能使用广域网来完成任务。大多数的厂商支持将数据倾倒到“运送”设备(一个设备、磁带等),以便可将数据更快地运送到恢复站点(假设与灾难恢复站点不同)。通常处于主站点的数据可能遭到了破坏,但是该站点本身没有遭到破坏,并且主站点往往是首选的恢复站点。如果数据以重复数据删除的格式被存储在灾难恢复站点的磁盘上,你往往想知道,如果要想将数据以其原本的格式传输到这些设备中会需要多少时间。

在关于在线处理和后期处理设备的不同读取性能的调查中我们发现,如果不将数据以最初的格式存储在磁盘高速缓存器的话,在线设备往往比后期处理设备的速度更快(大约3倍到4倍)。能够以400MBps的速度从在线重复数据删除设备中读取数据,与能够以100MBps的速度从后期处理设备中读取数据的差距可能会造成下载数据时的几个小时的差距,这取决于数据的数量。这一不同可能会对TTR产生巨大的影响。

成本和管理问题

不同的做法带来不同的成本开销和管理问题,因此你需要确保你已经完全了解了这些。一个主要的例子是,在与单数据流技术的性能进行比较的时候,了解不同厂商配置要求的型号和成本就变得十分重要,因为只有这样你才能获得最高级别的性能。如果一些做法需要更多的磁盘主轴来获得最高级别的性能的话,那么这将不仅对成本造成局限,还可能会对管理和其他问题(占地面积、能源消耗等)造成限制。在解决大的单一的备份任务的时候,吞吐量是了解TTR的一个可执行的指标,如数据库、单数据流(非聚集数据流)。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章