科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网存储频道重复数据删除技术成备份重点

重复数据删除技术成备份重点

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

以“备份到有用的数据”为宗旨的重复数据删除技术,成为存储厂商今年度的诉求重点。

作者:旷文溱 2007年6月26日

关键字: IEEE 重复数据删除

  • 评论
  • 分享微博
  • 分享邮件

    以“备份到有用的数据”为宗旨的重复数据删除技术,成为存储厂商今年度的诉求重点。

    相较于去年大谈磁盘备份的优点——可为企业节省搜寻回复近期档案的时间,进而达成信息生命周期管理(ILM, Information Lifecycle Management)愿景;今年存储厂商对于磁盘备份技术的看法显然更为实际,在今年企业数据量首度超越存储空间之际,包括了EMC和NetApp两大存储业者,都提出重复数据删除(Data De-duplication)技术的重要性,表示前者的最大优点,即在于缩减备份窗口时间以及节省后端的磁带备份空间。

    所谓的重复数据删除技术,意指扫描作业服务器(production)磁盘数据,判断数据是否为“重复”或“冗余”。原理是以算法切割磁盘里的数据成为区块(Block)或是区段(Segment),并为每一个分割单位求出一个特征值(unique ID),即可以代表此区块的数据。

    藉由这个特征值,系统就可以比对硬盘中已有数据新写入数据之间,是否具有相同之处。若是一致,即代表这笔数据为重复写入,系统便只会为这份数据留下一个索引(index),而不会重复存储占有磁盘空间。换言之只有特征值不同的数据才会被实际写入硬盘。

    有趣的是,由于重复数据删除技术为新兴技术,因此专注者反而都非领导的存储厂商,而是诸如Asigra、Avamar、Data Domain与Rocksoft等这类新创业者。
藉由收购Avamar,EMC亦取得了这项技术,并表示为该公司今年重点,EMC资深产品营销经理李百飞说。该公司指出,前者能将每日备份资料量减至300分之一,备份时间则可减少至10分之一。对于拥有5TB以上的备份数据量、集中在档案等非结构性数据的企业尤其适用。

    Avamar强调的是全局性的重复数据删除,也就是在数据产出时,即比对前者是否已经存在备份磁盘中,仅备份差异部分。即使企业的远程办公室欲存取或产出数据,亦可进行比对。

    “这对目前企业已经有将近七成的资料并非存在数据中心的现况,特别适用,”李百飞说。

    不过建置Avamar的价格不斐,要价在千万台币等级以上。因此EMC目前锁定的系本地金字塔顶端的大型企业用户,诸如医疗、IC设计业者。

    NetApp也在日前宣布推出重复数据删除技术 —NetApp A-SIS (Advanced-Single Instance Storage;不重复单元存储系统),适用于自家的NetApp NearStore和FAS存储系统。表示前者让用户能比传统模式节省高达20倍的空间,而且随着时间的推移可能达到更大的压缩比。

    “重复数据删除技术能让企业用户正视到磁盘备份的价值所在,”NetApp资深技术顾问姜群说。他表示虽然磁盘价格已经大幅下滑,但是由于成本仍和磁带有一段差距,导致迄今部分企业用户仍未大举采用磁盘。数据重复删除技术则能凸显磁盘备份较磁带备份的强项。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章