扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
在本页阅读全文(共4页)
随着磁带在成本上的优势逐渐变弱甚至完全消失,将基于磁盘的归档与基于磁带的归档作对比可以说是非常不公平的。这样的对比会暴露磁带的两个缺点:一是很难重新找到保存多年的数据集合中某个单一文件;二是无法保证磁带数据的完整性。
备份与归档的区别可以通过查看数据副本是如何应用来区别的。如果将原始数据副本用来进行数据保护的话,那就是备份。如果如果将原始数据副本保存到另一层级的存储中以备永久或者接近永久存储的话,那就是归档。
大多数使用磁带进行归档的用户会通过备份软件来对这个文件进行创建和管理。在备份过程中会创建一个数据库,这个数据库会追踪到什么文件在什么磁带上。往往这个数据库的拓展是由备份文件的数量和追踪那些文件所需要的时间长度决定的。大多数备份应用都需要你在一段时间或数据库达到一定的规模后对这些数据库进行重新整理。这对于那些希望或者可以摆脱磁带备份的用户来说是有利的。你仍然可以对磁带上的数据进行读取,但是你必须知道哪一个磁带上都存储了什么数据信息,然后你还要对那个磁带进行重新搜索。这个过程非常耗时,而且往往需要反复尝试,甚至需要一点运气。即使这个过程很顺利,你仍然需要面对数据读取的长期路径问题。
读取数据的长期路径成了人么争论的焦点,我自己就有无数次磁带搜索失败的经历。本身磁带是没有问题的,但是想要读取或者搜索数据就不那么容易了。原因有很多,但关键是你需要数据却无法重新找到这些数据。你可能会选择其他的媒介模式、不再使用可以读取磁带的驱动器;或者你会升级备份设备,不需要在刚刚安装的可以读取磁带的新操作系统中保留一份原始应用的副本。
除了重复数据删除技术,大多数磁盘归档系统都会打破这些局限。首先是数据的存取路径。数据会以本地或原始的格式保存在磁盘的文档中,而不需要以磁带特有的格式进行保存。在过去的十年时间内,对CIFS或者NFS挂载点(Mount Point)的读取方式并没有发生太大的改变。也就是在这十年间,我们看到了磁带形式(从DLT到AIT 到LTO)和这些形式多代技术(从DLT到Super DLT,从AIT 1到AIT 5,从LTO 1到LTO 4)之间发生了巨大的变化。你从一个有10年时间之久的网络卷上读取数据要比从有相同时间年份的磁带上读取数据容易的多。
仅仅通过目录导航就可以完成磁盘上的数据搜索,或者随着索引的不断完善,数据可以以内容来进行检索,像使用Google那样来使搜索数据更容易。而且,数据搜索往往并不需要在磁盘归档时迁移数据。大多数的归档都是以查找目标数据为目的的,也就是说你只需要查看一下数据信息而并不需要对这些数据信息进行修改。在这种情况下,你可以通过磁盘归档所保存的内容中查找到你需要的数据信息,而这对于磁带来说几乎是不可能的。
目前,电子信息内容的保留对大多数企业来说仍然是非常重要的。随着企业的制度法规和组织管理工作的日新月异,需要保留数据信息的时间年份越来越长,那么随着时间的流逝,你如何来保护这些文档,并且保证这些文档的完整性呢?
如果一个磁带丢失或者损坏,多数人就没有这个文档磁带多余的拷贝了。即使其中一些人留有拷贝,这些拷贝也不是立即就可以使用的,而且大费周折才能读取到你需要的数据。磁盘备份通常不是映射就是运行某种RAID架构,这种架构不仅可以提供读取数据的其他路径,而且不需要花很长时间,你马上就可以得到想要的数据信息。 此外,磁盘归档可以在数据丢失之前警告你驱动器或者存储介质正在发生故障,而磁带只能在你进行数据恢复的时候告知故障的发生。
那么你是如何确保数据本身不会发生丢失等情况呢?就磁带来说,唯一的办法就是定期对磁带进行扫描来查看数据保存情况,而且数据每隔三到五年就需要迁移到新的存储介质上。我现在还不太详细地了解IT专家做这项工作都使用什么工具和具体的时间周期。但是就磁盘归档来说,这一些都是自动的,不需要人为干预。大多数磁盘归档都有一种内置的算法,这种算法可以在数据保存的生命周期内持续对数据的完整性进行检查。
最后一层的数据保护就是复制。如果内嵌了合适的重复数据删除功能,将文档复制到远程站点的带宽要求就很低了。有了这种"近实时(Near-real-time)"的复制,你就完全不需要在数据添加到某个文档中的时候将其备份到磁盘或者磁带上了,从而大大削减了备份路径上的数据量。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者