扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
作者:存储时代——赵效民 2006年12月10日
关键字:
在本页阅读全文(共4页)
独特的索引技术 CommVault的骄傲
谈到备份,CommVault认为备份的目的在于日后可以恢复,如果不能及时而准确的恢复,那么再多的备份也没有用。当用户的数据量越来越大,需要备份的数据也越来越多时,就会面临一旦需要某个关键数据时,能不能迅速将其恢复。因此从某种角度讲,恢复往往更为重要!
Robert Hammer表示,在美国,一些法律要求在案件的诉讼阶段,需要双方限时提供相关文件以供审理,如果不能及时提供相关时段内的数据,就会判输,并以蔑视法庭的罪名进行处罚。前不久,著名的摩根·斯坦利银行就在一起金融诉讼中,因为有240多盘磁带的数据未能及时提供,被处以10多亿美元的罚款。由此可以看出备份可恢复的重要性。Robert Hammer自信的说到,如果摩根银行采用CommVault的技术就完全可以避免这一问题的出现。现在,很多的时候,所需的数据交叉于各种应用中,单从一种应用中的备份寻找数据是不够的,客户需要的是全平台应用中指定数据的恢复能力。比如一家金融公司被法院调查,需要找出与某一高管相关的所有数据,这其中可能包括了邮件,也可能包括了财务记录,显然这需要全方位精确查询的能力。如果没有很好的查询机制,就有可能像摩根·斯坦利那样,出现虽然磁带都在,但就不是不知道数据放在哪的尴尬场面。
那么CommVault在这方面有什么过人之处吗?CommVault产品管理总监梅立宏先生对此解释到,主要的区别就在于索引技术上。要想恢复指定的数据,就必须要知道它存在哪,而这个信息就是索引(Index),在备份时建立精确有效的索引机制,才会在恢复时不至于手忙脚乱。
CommVault备份索引机制图释
梅立宏介绍到,CommVault在备份时,会建立两套索引,一个是一级备份数据的索引,记录了备份数据的关键信息,另一个是二级备份索引,记录着索引的总体信息。一级索引分布在各备份服务器上,使用C-TRIEVE数据库进行检索,二级索引则相当于一级索引的索引,使用微软SQL数据库进行检索。这其中,二级索引的数据将一直累加,而一级索引相当于一个索引的缓存(Cache),为了保证索引的效率,其内建的索引条目将被限制在一定数量,当超过这一数量,将把最不常用的索引信息删除,日后若需要寻找相关的数据,可从二级索引库中进行查询。
但是,CommVault在索引机制上最独特的地方是,采用分布式关系式结构而非传统的目录式索引结构,可大大提高检索的效率,而且它还将数据的索引与数据一起保存到备份介质中(比如磁带、光盘等),也就是说,即使一级索引与二级索引都被破坏了,用户还可以从备份介质中找到索引信息,虽然恢复的速度要比一、二级索引还在时慢,但这种设计使得数据可恢复性大提高。而且由于这种机制使得索引的精细度可以大大提高,从而可以细化恢复的颗粒度,使精确而快速的定点恢复数据成为了可能。
那么这个索引信息存放到磁带上,会占用多少数据容量呢?梅立宏表示,对此大可不必担心,一条索引的容量也就几百个字节,占用容量很小,总体的磁带容量占用量最多在3-4%。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者