当下,公有云服务(Public cloud dispersion)需要符合GPDR(通用数据保护条例)的数据本地性限制,而对象存储的寿命也越来越复杂,因此,两者结合在一起就更增加了产品和管理的复杂性。

SwiftStack在这样的背景下更新了旗下的开源对象存储产品,推出了公有云归档、同步和多区域数据管理等功能。据悉,SwiftStack 5.0版是今年3月推出的,内置的Cloud Sync是一种从公有云往内部或从内部往公有云迁移数据的复制机制。
SwiftStack 现在的版本是5.9,是今年的第二个重要产品更新,5.9版增加了新的选项,可在单命名空间里使用多区域数据持久性和策略,同时还可以为数据本地性提供由GPDR驱动的选项。
其中,Cloud Sync工具具有政策驱动功能,可用于公有云归档和内部部署数据补余,此功能可以使归档数据在接到请求时在内部部署基础架构里进行自动补余。
另外尚存在类似Stubbing的形式。 SwiftStack会将冷数据自动送到公有云里,该数据仍可通过命名空间列表中的图标从单命名空间中访问,数据会从远程标为静止。而在数据被访问时,则会被送返到本地。
V5.9版现在提供多区域擦除(Erasure)编码。 SwiftStack表示,奇偶校验位不再扩展到所有可用区域,而是"使用每个区域的节点,在每个全局位置保持数据完整。这样做能在某个服务器节点脱机时可能使数据的可用性能得以保持,因此可以在请求或重建的情况下减少从其他地区传输大量数据的需要。"
公有云数据的放置现在可以更精确地得到控制,因为管理员"可以在每个区域中指定应该保留多少个数据副本,也可以根据分层策略指定每个区域内哪些节点用于存储数据,分层策略则可以将高容量节点和具有固态驱动器的低延迟节点结合起来。"
SwiftStack还称,"如果某个地区宕机或是必须移动某个应用程序,数据访问可以在其他地区的节点上自动完成,不需要任何更改。传统应用程序可以通过文件服务从单命名空间里访问和使用相同的数据,云应用程序则可以通过对象API执行此操作。"
传统应用程序需要与云应用程序共存及需要朝云应用程序转化,在此背景下,GPDR数据放置的粒度控制遇上了多区域、多云归档的需要性。其结果就是SwiftStack的生计会变得更加复杂。
好文章,需要你的鼓励
科技泡沫并非世界末日,从经济角度看,泡沫是押注过大导致供过于求。AI泡沫问题复杂在于AI软件开发节奏与数据中心建设周期的时间错配。甲骨文关联数据中心获180亿美元信贷,Meta承诺三年内投入6000亿美元基础设施。麦肯锡调查显示企业虽广泛使用AI但规模有限,多数仍持观望态度。微软CEO表示更担心数据中心空间不足而非芯片短缺,电力需求成为新瓶颈。
Salesforce AI研究团队构建了首个大规模多模态文档RAG评测基准UniDoc-Bench,包含7万页真实PDF文档和1600个问答对,覆盖8个领域。研究发现文本图像融合检索策略显著优于单一模态和联合多模态方法,为未来AI文档理解系统提供了"分工合作"的设计思路。
Goodfire.ai研究人员首次发现AI语言模型中记忆和推理功能通过完全独立的神经通路运作。研究显示,移除记忆通路后,模型丧失97%的训练数据复述能力,但逻辑推理能力几乎完全保留。令人意外的是,算术运算与记忆共享神经通路而非推理通路,这可能解释了AI模型在数学方面的困难。该技术未来有望用于移除版权内容或敏感信息而不损害模型核心功能。
腾讯研究团队发现AI训练中"推理火花"现象,揭示低概率词汇如"等等"、"不过"等在维持AI探索能力中的关键作用。团队开发的低概率正则化方法通过精准保护有价值的低概率词汇,在数学推理任务中实现60.17%准确率,比传统方法提升2.66%,为AI创造性思维研究开辟新路径。