Brotli是当今应用最广泛却鲜为人知的压缩格式之一,已被各大浏览器和内容分发网络广泛采用。然而在PDF文档领域,自1996年版本1.2以来,PDF一直采用FlateDecode过滤器进行压缩,该过滤器也被用于.zip和.png文件的压缩。
这一现状即将改变。PDF协会正推进在今年夏季发布规范说明书,供开发者在PDF处理器中添加Brotli支持。业界期待Brotli能够快速纳入由国际标准化组织维护的官方PDF 2.0标准ISO 32000-2。
随着PDF文件大小不断增加,企业数据湖中存储的文件数量每年激增数十亿,对更高效压缩方法的需求前所未有。
使用Brotli压缩的优势在于能显著减小PDF文件体积。根据PDF协会成员Artifex Software在2025年的测试,平均可减少10%至25%的文件大小,具体取决于所编码内容的类型。
然而对企业而言,这只是工作的开始。当采用Brotli压缩的PDF开始流通时,未更新应用程序和库依赖项的用户将无法解压和打开新格式文件。这对PDF来说是首次出现这样的情况——尽管自2008年成为ISO标准以来,PDF已添加众多新功能,但从未阻止用户打开PDF文件。
最主要需要升级以支持Brotli的软件包括专有PDF创建和阅读工具,如Adobe Acrobat、Foxit PDF编辑器和Nitro PDF。浏览器集成的PDF阅读器也属此列。
除此之外,还有大量不太显眼的开源工具、库和SDK生态系统,它们在企业PDF工作流和自动化批处理中被广泛使用。查找并更新这些组件,特别是那些隐藏在第三方库深处的组件,将耗时颇多。
如果企业延迟更新,则有可能遇到采用支持Brotli的新软件创建的PDF文件,这些文件将无法在其旧版、未更新的程序上打开。当用户联系IT团队报告无法打开文件时,IT人员将直面这一问题。
为了推动Brotli的采用,文档处理开发商Apryse的软件工程师Guust Ysebie指出,开发者需要鼓励和支持。他表示:"必须有人第一个跳出来并制造声势,这样其他产品才会跟进。"
这是一个挑战,因为如Ysebie在PDF协会网站的文章中所解释的,Brotli的采用速度缓慢,原因在于PDF规范需要数百个利益相关者达成共识。
他建议通过三种方式缓解这一过渡过程。最简单的方法是通过多种信息渠道宣传升级必要性,作为意识提升活动的一部分。
一个更激进的建议是,启用Brotli的PDF可以设置为使旧版阅读器不再崩溃,而是显示"不支持"错误信息,鼓励客户升级,作为压缩内容的占位符。
最后一种策略是,志同道合的开发者主动升级开源库。Ysebie表示他已为多个库添加了Brotli支持,包括Apryse的iText SDK。
他指出,这就是现实中采用的方式:先非官方地创建功能,然后早期采用者实现它,这促使更大的产品也采用它。采用Brotli软件的关键时刻将是其在Adobe Reader中的出现。这将在某个时刻发生,但具体时间仍不清楚。
好消息是,由于只有有限数量的软件库需要升级,为这些软件添加支持应该很直接。然而,企业仍需将这些更新的镜像应用到当前应用中。
关于何时将Brotli添加到ISO PDF 2.0规范(自2015年以来在进行中)中,Ysebie同意这还有很长的路要走。但业界必须在某个时刻从旧技术转向新技术。他表示,"我们需要推动生态系统向前发展。开始会有些混乱,但未来潜力巨大。"
Q&A
Q1:Brotli压缩格式相比传统FlateDecode有什么优势?
A:Brotli可以将PDF文件大小平均减少10%至25%,具体取决于内容类型。它已在浏览器和CDN中广泛应用,具有高度的可靠性和效率。
Q2:企业升级支持Brotli会面临什么挑战?
A:企业需要更新各种应用程序、库和SDK,包括Adobe Acrobat、Foxit等专有软件和众多隐藏在第三方库中的开源组件。未更新的系统将无法打开采用Brotli压缩的PDF文件。
Q3:Brotli的采用推广有什么障碍?
A:PDF规范需要数百个利益相关者达成共识,这导致采用速度缓慢。业界可通过提升意识、优化错误提示、开发者主动升级开源库等方式推动采用。Adobe Reader的支持将是关键转折点。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。