科技行者

行者学院 转型私董会 科技行者专题报道 网红大战科技行者

知识库

知识库 安全导航

至顶网存储频道如何更好的确定OnDemand存储文件压缩率

如何更好的确定OnDemand存储文件压缩率

  • 扫一扫
    分享文章到微信

  • 扫一扫
    关注官方公众号
    至顶头条

IBM DB2 Content Manager OnDemand在存储管理对象时具有压缩机制,准确的压缩率对整个数据存储需求的估算具有实际的意义。本文主要介绍了如何更好的确定OnDemand存储文件压缩率的方法。

2007年9月7日

关键字:

  • 评论
  • 分享微博
  • 分享邮件
    IBM DB2 Content Manager OnDemand在存储管理对象时具有压缩机制,准确的压缩率对整个数据存储需求的估算具有实际的意义。本文主要介绍了如何更好的确定OnDemand存储文件压缩率的方法。

    在将数据存储到高速缓存存储器和归档存储器之前,IBM DB2 Content Manager OnDemand 可以使用几种不同的数据压缩算法压缩报表数据。OnDemand 能够达到的压缩率对存储报表所需的空间数量有重要影响。

    IBM DB2 Content Manager OnDemand提供了三种压缩方式LZW12、LZW16 和OD77。要确定某种特定类型输入数据的最佳压缩方法,IBM 建议您使用 OnDemand 提供的三种压缩方法(LZW12、LZW16 及 OD77)中的每一种来压缩数据样本。

    根据数据类型和数据格式,IBM DB2 Content Manager OnDemand 能够达到的压缩率变化很大。但仅通过检查数据来估计压缩率并不总是准确的。对于 AFP 文档,您可以期望达到的压缩率平均在 2:1 和 15:1 之间;对于行数据报表,压缩率平均最高可达 30:1。对 AFP 文档的压缩是基于 ACIF 生成的输出数据文件,而不是可能为行数据的输入文件。当 ACIF 使用页定义格式化行数据时,它可以通过为定位文本添加 AFP 控件来增加数据的大小。

    要正确估计报表所需的存储空间数量,IBM 建议您测量在报表样本上达到的压缩率。可通过使用 ARSADMIN 程序测量压缩率。例如:

    对于包含逻辑项的报表(例如财务报表和保险单),请使用以下示例:
arsadmin compress -l 200000 -s inputFile -o outputFile
其中,inputFile 是要测量的报表,而 outputFile 是压缩输出。

    要确定压缩率,请按长度(-l 200000)划分 outputFile 的大小。例如,如果 outputFile 的大小为 66,000 字节,则压缩率为 66000/200000 或 0.33(3:1 压缩)。

    对于包含行数据和包含已排序的事务值的报表而言(例如总分类帐),首先确定页的索引组的大小,如 100 页。然后从大型报表中抽取页组并使用 ARSADMIN 程序处理它们。例如:

arsadmin compress -s groupPages -o outputFile

     其中,groupPages 是一个包含更大的报表中一个有代表性页组的文件,而 outputFile 是压缩输出。

     要确定压缩率,请按 groupPages 划分 outputFile 的大小。例如,如果outputFile 为 40,000 字节,而页组的大小为 200,000 字节,则压缩率为 40000/200000 或 0.20(5:1 压缩)。

参考资料:
IBM Content Manager OnDemand Introducing and Planning
IBM Content Manager OnDemand Administrator guide

 

    • 评论
    • 分享微博
    • 分享邮件
    邮件订阅

    如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。

    重磅专题
    往期文章
    最新文章