作为世界上最大的能源生产国和消费国,我国明确提出2030年“碳达峰”与2060年“碳中和”目标,在此趋势下,千行百业竞相开启了针对绿色低碳技术的应用和完善。同时,随着《“十四五”数字经济发展规划》的落实,也让市场聚焦在数字产业的核心:数据上面。不过在这其中,容易被忽视的正是数据对于可持续发展的影响。
容易被忽视的“节能杀手”
如今,在混合多云的环境下,数据管理的挑战与日俱增。多云数据管理领域的领导者Veritas研究显示,受疫情的影响,87%的中国受访者采用了新的云功能或扩展了云基础设施,这一数据高于全球平均比例(80%)。这意味着,需要云存储的数据越来越多;同时,云资源存在过度调配,以及云实例使用效率仍需优化等挑战。
根据Veritas调研,全球企业数据存储中,平均52%的企业数据未经分类和标记,成为难以治理的暗数据。而在中国受访者中,只有58%的人能够准确说出公司现在使用的云服务的数量,但是也不清楚可能需要保护的数据。平均而言,受访企业所存储的数据中,约有35%为“暗数据”,也就是说,他们不知道那是什么。此外,另有约42%为冗余、过时或琐碎的数据(ROT)。
此前,对暗数据的探讨更多聚焦于其对企业财务成本的消耗,而环境因素往往被人们忽视。IDC分析预计称,截止2025年,全球数据存储量将从2018年的33ZB激增至175ZB,如不改变当下的数据治理策略,暗数据也将于五年间连翻四倍,增至91ZB,而存储数据所需的能耗也将随之迎来四倍攀升。美国数据中心能耗报告显示,1PB未经优化的备份数据在云中备份一年,所需的用电量可以为1000个10瓦的LED点亮整整一年,同时还会产生高达3.5公吨的二氧化碳废物,它大约相当于将一辆普通的家用汽车从北极开到南极所产生的排放量。Veritas的数据也发现,2020年大约有640万吨的二氧化碳因为不必要的数据释放到大气中,而640万吨的二氧化碳相当于一辆汽车绕地球57.5万圈的排放量,相当于80个国家的年排放量。
Veritas NetBackup 10:更经济、节能、高效和安全的数据保护管理
为了更好地保护环境,降低企业不必要的存储运维开支,如何优化数据管理已成为企业的当务之急。向更可持续的云计算的转变已经来临,企业需要掌握有效的数据管理方法,为节能减排尽一份力量。
为更好地支持全球企业降低存储成本、减少碳足迹,实现可持续发展,Veritas总结并提出如下几点建议:
? 识别数据存储,获取全面洞察:发现数据、定位数据是理解企业内信息如何流动的首要步骤。了解不同数据及敏感信息的存储位置,洞察访问权限归属以及数据留存期限将有助于企业发掘暗数据;
? 循迹暗数据:企业需对数据进行主动管理,通过获得数据、存储和备份基础架构的相关洞察,企业可有效控制相关数据风险,并分辨出哪些数据可以放心删除;
? 自动化执行洞察任务:在数据管理中,企业需处理的数据往往高达数PB级,相关文件也多达几十亿份,企业应集成其数据洞察、归档、备份和安全解决方案,从而防止数据丢失,确保数据按策略留存;
? 严控数据总量,限定数据用途:控制数据总量,制定灵活的数据留存和数据合规策略将有助于支持企业删除无用信息,为整体数据合规、暗数据治理奠定基石。
同时,Veritas还通过具体举措来落实环境保护,并帮助企业降低不必要的运维开支。在今年,Veritas发布了全新版旗舰产品NetBackup 10,这有助于企业减少云资源消耗和成本,保护数据免受勒索软件的侵害,并为数据自治打造坚实基础。全新的NetBackup 10是业界首个云优化,可规模化使用的数据保护管理解决方案,它可以将云存储成本降低95%,其云自动扩展功能可以节省40%的云资源调配成本,减少网络威胁,并有效解决多云的有效使用和合规性等问题。在NetBackup 10中,来自快照的弹性备份与新的云端重复数据处理引擎协同工作,消除了存储冗余;重复数据删除引擎经过优化,效率提高,压缩的数据更多,占用的内存也比以前更少,大大提高了云资源的利用率。
面对环境保护这个持久性话题,每个人和每个企业都可以在其解决方案中发挥积极作用。Veritas将继续践行对环境可持续性的承诺,并通过NetBackup 10来帮助企业优化存储的数据,为地球创造一个更可持续的未来。
关于Veritas
Veritas Technologies是多云数据管理领域的领导者。超过八万家企业级客户,包括 87%的全球财富 500强企业,均依靠Veritas确保其数据的保护、可恢复性和合规性。Veritas在规模化的可靠性方面享有盛誉,可为企业提供抵御勒索软件等网络攻击威胁所需的弹性。Veritas通过统一的平台,支持超过800种数据源,100多种操作系统,1400多种存储设备以及60多类云平台。在云级技术的支持下,Veritas现正在实践其自治数据管理战略,在提供更大价值的同时,降低运营成本。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。