如果告诉一家企业,你将损失三分之二的消费者,企业管理者会不会大惊失色?这可不是耸人听闻。事实就是如此,当企业储存了大量无用数据而没有及时、恰当进行删除和管理,这种情况就可能会噩梦成真。那么有多少企业正面对这种噩梦呢?
一个大家忽略的事实是,其实有很多企业和组织仍在通过存储他们不需要的数据而不是他们认为有用的数据来造成更多污染——平均而言,这里面只有15%的数据对业务至关重要。对此,消费者持有明确的观点。Veritas近期发布的《消费者对企业数据可持续性看法报告》表明,在中国有超过三分之二的消费者(68.3%)认为,当不再需要信息时,在线存储信息的组织则有责任将其删除。同时也有超过三分之二(67.7%)的中国受访者表示,如果他们知道某家公司因未能控制其存储的不必要或不需要的数据而故意造成环境破坏,他们将停止从该公司购买产品。
企业管理者可能不由得问,为什么消费者会产生如此强烈的反应?
众所周知,大部分储存着无用数据的数据中心是用化石能源供能的,它们是二氧化碳的重要排放源。事实上,数据中心产生的碳排放占全球碳排放的2%,相当于整个航空业的排放量。
或许很多企业并没有意识到这一点,或者还不够重视,但要知道,根据《消费者对企业数据可持续性看法报告》,63%的中国消费者对此深感忧虑。有超过四分之三(77.8%)的中国消费者表示,希望看到企业采取能够控制其数据储存对环境产生的负面影响的解决方案。
因此,为了保护环境,进而维护企业利益,以下是三项可以考虑的最佳数据管理措施:
1.及时分类整理企业数据
如果企业不了解数据的内容和存放位置,比如存在暗数据,就无法正确地管理数据,更无法控制数据对环境的影响。因而企业应创建一个最适合自身的系统,对数据进行识别、标记和分组。
2.经常归档并删除过时和琐碎的数据
如上所述,很多企业都囤积了海量数据(即使他们了解这些数据是无用的)。清理此类数据不仅能保护环境,还能削减企业数据存储的开销,提升数据安全性以应对勒索软件等威胁,并降低与数据治理与合规性相关的监管风险。
3.定期删除重复数据,避免数据冗余
删除重复数据是清除现有数据的不必要副本。当数据冗余被正确利用时是有益的(例如在进行3-2-1-1备份时),但大多数企业的普遍问题是,太多非战略性的数据冗余对企业的预算和环境都有害。这些冗余(Redundant)、过时(Obsolete)、琐碎(Trivial)的ROT数据会导致数据安全风险增加、增加数据合规性和治理风险、增加责任风险、降低生产力、增加存储成本等。
从很多角度,特别是从减少企业碳足迹的角度来说,这些举措都是十分必要的,但这三项措施可能会很复杂,特别是在每天产生和存储数百万兆(TB)新数据的大型企业中。而解决这些问题的正解即构建一个统一的数据管理平台,使流程自动化。现在一些企业甚至运用人工智能实现了从流程自动化到流程自治化的转型。否则企业则面临着手动审计数据并开展后续工作的困境。这不是一项能一劳永逸的工作,而是一个需要持续精进的过程。
另外,Veritas建议企业谨慎选择云存储服务供应商。美国数据中心能耗报告显示,1PB未经优化的备份数据在云中备份一年,所需的用电量可以为1000个10瓦的LED点亮整整一年,同时还会产生高达3.5公吨的二氧化碳废物,它大约相当于将一辆普通的家用汽车从北极开到南极所产生的排放量。为了减少企业数据碳足迹,企业应选择与自身一样具有高环境可持续性标准的云供应商,以将企业数据管理平台扩展到多云基础设施,从而进一步优化基于云的数据。
正如Veritas公司首席可持续发展官Rags Srinivasan所说,如果不识别和消除不必要数据,对企业和环境的风险将会太大,大到无法再坐视不管了。Veritas建议企业采取以上实践,从而防止企业成为环境的破坏者。
关于 Veritas
Veritas Technologies是多云数据管理领域的领导者。超过八万家企业级客户, 包括95%的全球财富100强企业,均依靠Veritas确保其数据的保护、可恢复性和合规性。Veritas在规模化的可靠性方面享有盛誉,可为企业提供抵御勒索软件等网络攻击威胁所需的弹性。Veritas通过统一的平台,支持超过800种数据源,100多种操作系统,1400多种存储设备以及60多类云平台。在云级技术的支持下,Veritas现正在实践其数据自治战略,在提供更大价值的同时,降低运营成本。
Veritas中国官方网站 https://www.veritas.com/zh/cn/
Veritas官方微信平台:VERITAS_CHINA(VERITAS中文社区)
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。