科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网存储频道分层数据保护 不可不知的IT秘密

分层数据保护 不可不知的IT秘密

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

目前在重要存储系统中的数据里,有60%到80%的数据是静态的。这些数据在被创建出来之后,已经有超过90天甚至更长的时间没有被使用过了。这是非活动或者处理完毕的数据,不应该属于第一层级的存储,它们无须进行频繁地备份

作者:存储时代(编译) 2007年9月17日

关键字: 重复数据删除 备份 数据保护

  • 评论
  • 分享微博
  • 分享邮件
IT经理们都知道在他们的数据保护策略中有很多严重的漏洞。他们知道他们所在的公司的数据并没有得到妥善的保护,他们知道如果出现灾难或者故障,需要恢复数据的话,他们的秘密就会被揭露出来。最好的情况是,恢复数据需要花费相当长的时间;而最坏的情况是,数据根本无法恢复。

    除了手动地翻阅一页又一页的备份日志,随着备份量的增加,日志也在不断变厚,他们无法知道到底面临着什么样的风险。IT部门采取的对策是一遍又一遍地复制同样的数据,希望这样做能够降低他们的总体风险。但是随着数据量的不断增长,这些数据的价值越来越被企业了解,问题恶化了。

    幸运的是,由于基于磁盘的备份已经逐渐普及,数据管理和备份报告能力的提高,以及其他一些的新技术(例如重复数据删除),今天的数据保护已经和以往大为不同——应该说改善了很多。

    和几年前相比,今天的备份和恢复环境有了更好的可见度,IT管理员也有了更好的控制力。他们不仅可以看到数据保护环境里发生的情况,确保指定窗口的备份完成了,他们还能够通过确认网络或磁盘驱动器上的问题,提前避免备份失败。

    除了这些,基于磁盘备份环境的高级技术和相关软件也发展到了相当的程度,IT管理员可以从一大堆数据保护技术(有时候这些技术是同一家供应商提供的)中,根据数据的重要性和变动频率选择适当的保护措施。IT管理员也许会选择CDP(Continuous Data Protection,连续数据保护)技术来保护经常变动、非常重要的数据(它可能会有一个RPO(数据恢复点目标),RTO(数据恢复时间目标)可能是0),对于那些不那么重要的数据,则可能使用虚拟磁带库(VTL)或者近线磁盘设备进行备份。无论数据的性质或特点,都使用CDP级保护的做法未免是大材小用——而且从容量和费用角度考虑,也是一种浪费。

    我们和最终用户的交谈以及ESG Research对于磁盘备份的调查都显示出IT经理们理解分层数据保护环境的价值。但是有趣的是,很多管理员并没有在最重要的存储级别中应用这一理念。他们把很多不必要的数据也放到重要存储系统之中。这是IT部门新的“肮脏的小秘密”。

    ESG估计目前在重要存储系统中的数据里,有60%到80%的数据是静态的(或者持久的)。换句话说,这些数据在被创建出来之后,已经有超过90天,甚至更长的时间没有被使用过了。这是非活动或者处理完毕的数据,不应该属于第一层级的存储,它们无须进行频繁地备份。

    将固定不变的内容从昂贵的重要存储系统转移到比较便宜的次级存储之中,企业这样做能够极大地降低费用和运作成本,同时还能够确保高的可用性、安全性,数据也可以被快速访问到。

    使用成本更低廉的存储系统、将真正重要的应用数据(因此甚至可以取消或者推迟一些存储系统采购的计划)存放到重要磁盘系统之中,能够帮助企业极大地降低成本。一级和二级存储之间不同的数据管理流程降低了管理成本。

    将通常会保存在磁带上的那些重要的静态业务数据保存在适当的次级存储层设备上,它可以在调整等时候被访问。这个层可以是任何技术方案,包括SAN、NAS、CAS、MAID或者甚至是基于磁盘的备份设备(NAS或者VTL)。这个层也可以是基于光盘的,或者结合运用几种技术。你应该考虑使用ESG称为Enhanced Tiered Storage(ETS)的技术,它围绕着存储系统,提供了提高容量效率的技术,例如自动精简配置、重复数据删除、逻辑镜像或者可写的镜像。

    我们都知道从磁带上恢复数据是一个漫长的过程,可能会破坏业务连续性。从介质管理的角度看,次级存储技术比基于磁带的方案更便宜。在这类环境中,不需要管理磁带。

    如果单纯从能耗和制冷角度看,把数据从一直运转的重要磁盘资源转移到更有效的次级存储系统,无疑是有好处的。电费平均是每千瓦时9.28美分,所以能够大幅度地降低成本。考虑到重复数据删除的因素,节省的费用则会更多。

统计数据反映出的真相

    如果你不能确定是否需要一个分层的存储环境,看看一下下面的统计数据:

    • 恢复的数据中,有56%的数据不超过2天。(数据来源:ESG Research,企业数据保护的演变)

    • 90%的数据从创建之日起,90天里都是静态的。(数据来源:Storage Networking Industry Association)

    • 从2005年到2010年,数据存储容量将飞速增长,超过25,000 PB。(数据来源:ESG Research,数据存储:最终用户调查和2006到2010年市场预测)

    • 阵列中60%到80%,甚至更多的数据都是非处理或者已经处理完毕的数据,这些非处理数据中至少有一半的数据是对非处理数据的备份。(数据来源:ESG)

    • 数据中心的电力消耗从2000年到2005年增长了97%,目前已经占到全美电力消耗的1%到2%。(数据来源:全美和全世界服务器消耗的能源总量估算,Jonathan G. Koomey, Ph.D)

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章