活跃存档联盟定义了三个存档层级WORM、WORSe和WORN,认为生成式AI需要快速访问近期存档数据,这要求动态访问能力。
这些层级定义在一份14页的特别报告中,题为"通过活跃存档为明天不断扩大的存储挑战做准备"。报告指出:"随着组织越来越需要快速访问大量历史数据,活跃存档的概念已成为长期和无限数据保存策略的基石。人工智能、商业智能、医疗保健和科学研究等行业正在挖掘存档数据以获取此前被忽视的洞察。这一转变正在将数据存档从被动存储库转变为主动引擎。"
活跃存档采用两种或更多存储介质技术,包括硬盘驱动器、固态硬盘、磁带、光盘,通过智能数据管理软件进行管理。实际存储设备可以部署在本地或公有云中,通常具有S3或Azure Blob接口。存档层级从相对热存储(固态硬盘、硬盘驱动器)、温存储(硬盘驱动器、光盘)到冷存储(磁带)不等。
报告展示了数据生命周期图:数据通常随着老化和访问频率下降从左向右流动,但也可能重新需要并向左回流,图表显示数据会在短时间内变为热数据。
活跃存档联盟报告提出了三个存档访问层级:WORM(一次写入,多次读取)、WORSe(一次写入,很少读取)和WORN(一次写入,从不读取)。这些层级对应三种存档类型:活跃、存档和深度存档。
进一步的图表显示了这些层级中可能的数据类型分布百分比。
AI模型的兴起以及智能体分析和处理历史业务数据的相关需求,对快速访问提出了更高要求。但这意味着需要使用固态硬盘来实现最快访问,而即使是大容量QLC固态硬盘,每TB成本仍然比磁盘驱动器更高,尽管耗电更少。访问性能、功耗成本和介质成本之间的这种紧张关系在短期内不太可能得到解决。
在2026-2028年期间,250TB和500TB级别的更高容量固态硬盘可能会缩小硬盘驱动器与固态硬盘之间的价格差异,从而促进其在活跃存档中的使用。
在性能范围的下端,可以预见磁带存档可能会被推回到更冷的数据存储中,因为基于玻璃的光学存储(如Cerabyte正在开发的技术)可能会在磁带和磁盘之间提供新的存储层。这种可行性将在2026/2027年时间框架内变得更加清晰。
备注
活跃存档联盟的十三个成员和赞助商包括:Arcitecta、BDT Media Automation GmbH、Cerebyte、富士胶片、IBM、Iron Mountain、MagStor、Point、Savartus、Spectra Logic、Wasabi、西部数据和XenData。Folio Photonics曾是成员,但其光学存储产品上市困难与会员资格失效同时发生。
BDT制造磁带库。
Savartus成立于2024年底,是从Rimage Corporation活跃存档部门独立分拆出来的公司。
Q&A
Q1:活跃存档联盟定义的三个存档层级是什么?
A:活跃存档联盟定义了三个存档访问层级:WORM(一次写入,多次读取)、WORSe(一次写入,很少读取)和WORN(一次写入,从不读取)。这些层级对应三种存档类型:活跃、存档和深度存档,旨在应对AI需要快速访问历史数据的挑战。
Q2:为什么生成式AI对存档数据访问提出了新要求?
A:生成式AI模型以及智能体需要分析和处理历史业务数据来获取洞察,这对快速访问提出了更高要求。AI、商业智能、医疗保健和科学研究等行业正在挖掘存档数据以获取此前被忽视的信息,这一转变正在将数据存档从被动存储库转变为主动引擎。
Q3:活跃存档系统使用哪些存储技术?
A:活跃存档系统采用两种或更多存储介质技术,包括硬盘驱动器、固态硬盘、磁带和光盘,通过智能数据管理软件进行管理。存储设备可以部署在本地或公有云中,通常具有S3或Azure Blob接口。存档层级从热存储到冷存储不等,以平衡访问性能、功耗成本和介质成本。
好文章,需要你的鼓励
AI颠覆预计将在2026年持续,推动企业适应不断演进的技术并扩大规模。国际奥委会、Moderna和Sportradar的领导者在纽约路透社峰会上分享了他们的AI策略。讨论焦点包括自建AI与购买第三方资源的选择,AI在内部流程优化和外部产品开发中的应用,以及小型模型在日常应用中的潜力。专家建议,企业应将AI建设融入企业文化,以创新而非成本节约为驱动力。
字节跳动等机构联合发布GAR技术,让AI能同时理解图像的全局和局部信息,实现对多个区域间复杂关系的准确分析。该技术通过RoI对齐特征重放方法,在保持全局视野的同时提取精确细节,在多项测试中表现出色,甚至在某些指标上超越了体积更大的模型,为AI视觉理解能力带来重要突破。
Spotify在新西兰测试推出AI提示播放列表功能,用户可通过文字描述需求让AI根据指令和听歌历史生成个性化播放列表。该功能允许用户设置定期刷新,相当于创建可控制算法的每周发现播放列表。这是Spotify赋予用户更多控制权努力的一部分,此前其AI DJ功能也增加了语音提示选项,反映了各平台让用户更好控制算法推荐的趋势。
Inclusion AI团队推出首个开源万亿参数思维模型Ring-1T,通过IcePop、C3PO++和ASystem三项核心技术突破,解决了超大规模强化学习训练的稳定性和效率难题。该模型在AIME-2025获得93.4分,IMO-2025达到银牌水平,CodeForces获得2088分,展现出卓越的数学推理和编程能力,为AI推理能力发展树立了新的里程碑。