科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网存储频道纠错:文件存储的迫切需求

纠错:文件存储的迫切需求

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

前不久我参加了一个由美国政府机构主办关于归档保留(设备必须永远用数字格式保存信息)的研讨会,在我看来,文件需要被更好地保护以确保这种归档是有意义的。

作者:存储时代(编译) 来源:Stor-age.com 2009年12月7日

关键字: 文件存储 重复数据删除

  • 评论
  • 分享微博
  • 分享邮件

在本页阅读全文(共2页)

广播行业的先例

ECC方法存在已经有十几年的时间,现在是时候开始使用这种方法,这样文件就不会在字位出错的时候丢失。由于现在各种压缩技术的普遍应用,丢失一个字位可能就意味着丢失整个文件。你遇到过多少次在家里打开一个数字图片却发现它是不可读的?

回溯到90年代的时候,当时有不少RAID厂商忽略了广播行业的读取错误问题。这些厂商之所以这么做是因为,如果你正在一个播放超级杯的商业广告,那么在重播的时候丢失几个字位总比无法正常播放这个商业广告而丢掉几百万美元收入要强得多吧。而且通常丢失几个字位甚至不会被注意到。众所周知,在广播行业丢掉几个字位总比失去正常发送广播的机会要好。现在我们面临的难题是,由于需要对图片、视频和音频的压缩算法,现在丢失几个字位所带来的影响可比90年代处理未压缩格式数据丢失字位大得多了。

一些应用为每个文件生成一个校验和,但是这并不能解决文件中的问题,它只会在你无法播放的时候告诉你文件已经发生变更。我是压缩技术的狂热爱好者,也许我们需要做的就是从重复数据删除领域学到一些经验。很多重复数据删除产品都采用了ECC,可以对每个块进行修正。不同厂商使用的ECC数量各有不同,但是你为岳母的照片文件创建的误差校正码也许跟美国政府保存归档文件所需的误差校正码是不同的。

当然我希望在IRS记录上使用比水下照片更多的ECC,不过我更愿意牺牲磁盘空间、CPU、内存带宽和时间来处理这些ECC。如果有一种在需求变化的时候设置和重新设置误差校正码数量的方法就好了,但是文件格式仍然在某个误差校正码所处扇区出现故障时显示文件。这种情况下我不会丢失整个文件,以我的水下照片为例,如果一张鱼的照片鱼眼部分无法显示,那么至少显示其余部分的图片,这样我可以使用Photoshop来修补一下。

在我看来,文件和数据完整性必须有所改变,否则最终我们将丢掉所有长期归档数据。对于全球的各个行业和政府来说,丢失这些数据的潜在成本和丢失我们共享历史的威胁意味着我们必须做些什么。所有都开始变成数字化的,从医疗记录到老电影、图片和文件。现在的方法在过去也许是有效的,但是在将来并不一定奏效。

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章