科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网存储频道技术进步反倒成为数据归档最大绊脚石

技术进步反倒成为数据归档最大绊脚石

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

技术是归档面临的最大难题。归档内容日益庞大,需要保存的数据量自然也随之水涨船高,甚至带来归档设备容量溢出的威胁。技术变革可能会最终拿出理想的解决方案,但问题却也正是出在技术变革的过程当中。实现愿望是要付出代价的,大家务必谨慎。

作者:编译 来源:ZDNet存储频道 2013年4月5日

关键字: 数据归档 LTO 大数据

  • 评论
  • 分享微博
  • 分享邮件

在本页阅读全文(共2页)

技术的进步令困扰存储的负面影响大大减少。

如何解决数据归档面临的巨大挑战?

荷兰皇家石油公司在东印度群岛(今印度尼西亚)修建的码头。

百年归档史

这方面讨论如果要延展开来有很多内容可讲。就以曾经的世界第二大营收企业壳牌公司为例(也就是当年的荷兰皇家壳牌公司),其发展道路前后跨越了106年。而在这100多年岁月中,企业几乎始终(除了最近几年)坚持以纸质记录方式保存文件。

如果磁带归档机制也要运作上百年,结果会如何?

每两年多磁带的记录格式都会发生更新换代。LTO-1最初发布于2000年,单体容量为100GB。如今13年过去了,我们已经开始采用容量达2.5TB的LTO-6;相当于13年间陆续出现了六代记录格式。即使把归档记录格式的更迭周期延长为五年(而不是实际上的两年),一个世纪的跨度仍然意味着我们要经历20次磁带格式变化。

由于归档内容对容量的需求持续增长,我们需要不断将原有磁带上所记录的信息迁移到新磁带当中。可以说磁带归档机制把大部分资源都用在了数据迁移上,其占用率甚至超过为归档用户数据访问请求所分配的资源。尽管这一轮换过程只发生在基础设施内部,但永无休止的数据迁移工作必然导致用户访问的成本一路飙升。

我们甚至从不指望着Word 2113能读取Word 2013格式的文档;除非数据内容能在格式保持不变,否则这一切问题都无法得到根本解决。

总之,这完全属于无稽之谈。

除非我们能够达到归档技术趋于稳定的高度,使其拥有与纸张及印刷那样几十甚至上百年不变的特性;否则我们绝不可能保留全部以数字化形式收集到的信息。那些最陈旧、访问频率最低的数据必然会被删除掉——除非某些信息拥有明确的保留必要性,否则数字化过滤机制一定会将其视为垃圾内容并加以清理。

归档将接受数字化蜘蛛机器人的搜索,并在这位数据杀手的管理下摧毁无用数据、为常用数据腾出存储空间。

有些人可能会借此机会开拓新的业务领域:把陈旧数据以某种方式深度冻结起来,以备需要时随时唤醒。也许这类存储设施会被安置在月球上、超大规模核动力闪存库中,总之需要有充足的空间进行规模扩展;虽然火山口听起来也是合理的存放地点,但这实在有点太过科幻了。

讨论了这么多与现实脱节的内容,我们得出的结论是,其实没有哪种数据是需要永远存在的。就连最疯狂的大数据拥护者们也承认数据化归档系统需要定期进行清理。物理空间越发有限、数字化空间也开始吃紧、格式变动不可避免、应用程序更新换代、随着时间推移陈旧数据的访问成本将变得越来越高。

技术变革可能会最终拿出理想的解决方案,但问题却也正是出在技术变革的过程当中。实现愿望是要付出代价的,大家务必谨慎。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章