扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
作者:论坛 来源:论坛 2011年3月7日
关键字: 重复数据删除
本文将为大家简单介绍重复数据删除“指纹”算法保障数据完整性的相关内容,以下是文章的详细内容,有兴趣的读者不妨看看此篇文章,希望能为各位读者带来些许的收获。
随着数据的急速增长,重复数据删除以其显著的功能优势在存储系统中获得了越来越广泛的应用。在初次全备份实现3~4:1的压缩比后,长期使用中可以获得约95%的惊人数据缩减,从而极大地减少了对备份系统存储资源的需求。
“指纹”算法保障数据完整性
重复数据删除技术的实现中,系统通过计算并检查数据块(或文件)的“指纹”,判断该数据块是否与已经存储的“元数据”重复。
如果重复,则只需要保留指向该“元数据”的指针;如果“指纹”显示该数据块(或文件)是全新的,则保留该数据块,并作为“元数据”供以后使用。
因此,数据块(或文件)“指纹”的获得是重复数据删除技术的核心,在目前各主要厂商的实现中,“指纹”算法采用的基本都是密码处理中散列函数(hash)算法。
良好的散列函数算法可以保证为不同的数据块产生不同的散列值,从而作为重复数据删除技术中的数据块(或文件)的“指纹”。
然而,为了保证散列函数的抗碰撞(collision-resistance,即不同数据块的散列值相同)特性,散列函数算法需要引入大量密码学处理技巧,从而大大增加了数据块(或文件)“指纹”计算对系统处理资源的需求,因此也就导致了系统性能难以进一步提高。
散列函数作为重复数据删除技术的“指纹”算法是可行的,其对“备份数据完整性”的威胁仅仅存在于理论计算中,而不会对实际应用造成任何实际影响,主流重复数据删除方案提供商多年的实际应用也证实了这一点。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。