如今,众多企业在加速数字化转型的同时,也催生了多云场景。尽管采用多云战略有着显著优势,但其中的数据管理和保护却是个颇为艰巨的挑战:随着企业转向云原生技术来构建应用和新服务,容器成为数字化转型的具体体现,焦点也自然转移至Kubernetes上面。
最近,Veritas针对Kubernetes的一项调研发现,在部署了Kubernetes环境的中国企业中,有35%在容器化环境中经历过勒索软件的攻击;而已经部署Kubernetes环境的中国企业中,只有35%具备防范勒索攻击等数据丢失事件的保护措施;同时,有高达73%的中国受访者认为勒索软件对Kubernetes环境的攻击是其企业目前面临的一个严峻问题。
由于Kubernetes有着易于部署、更经济、更灵活和可扩展的优点,它正被迅速部署到全球企业的关键任务环境中。也正是因为其部署非常简单,导致了企业往往在部署Kubernetes方面比保护Kubernetes方面要先进得多。通过上述的调研数据,可以看出这些企业有近三分之二的关键任务所处的Kubernetes环境完全没有得到保护, Kubernetes已经成为企业勒索软件防御战略中的致命弱点。
正视Kubernetes环境数据保护的三大挑战
企业在Kubernetes环境下的数据保护漏洞频出,究竟是意识不到位还是能力不足?在我们看来,大多数企业不缺安全意识,我们很多客户也在一定程度上实现了安全运维。真正的问题在于,安全运维本身就是一个动态话题,并非实现了某些安全运维的解决方案,部署了Kubernetes或者其他的安全工具,就能一劳永逸了。
在此前提下,我们把企业面临的Kubernetes数据保护挑战总结为以下三点:
1.如何保证容器环境的备份效率。进行Kubernetes环境保护的时候,不能降低企业自身Kubernetes的运维水准,所以必须要在数据保护平台的架构层面就能实现和Kubernetes环境、架构的契合。那么企业就需要考虑大规模Kubernetes环境的保护、恢复时,总体拥有成本是否合理、扩展性是否会被限制在某一个烟囱里等因素,以上都给容器环境的备份效率提出了更高要求。
2.如何保证针对Kubernetes的容器应用复杂性,进行一致性保护。多云环境下的运维非常复杂,作为一个消除运维复杂性的工具,Kubernetes本身的复杂性也不容忽视。如今,保护Kubernetes环境已不像以往保护一个虚机、客户端或者一个存储那么简单,因为一个Kubernetes环境下的业务涉及上千甚至上万个微服务容器环境,还需要进行复杂的编排。如果没有把一个业务涉及到的所有资源看作一个整体,并且处理好不同Kubernetes微服务之间的编排关系,那么最终还是无法恢复业务。
3.可移植性的遵从。用户之选择Kubernetes的重要原因之一是其高度的可移植性。如果数据保护不支持可移植性,无法保证备份之后的数据在不同的物理数据中心和云之间、不同的云之间、不同的商业版本之间移植,那么Kubernetes就会形同虚设,失去了部署的价值。
用“统一的数据保护解决方案”来替代“烟囱式解决方案”
不可否认,当下不少企业解决Kubernetes数据保护问题还停留在传统的工作负载角度。从Veritas最新调研可以看出,有一半的中国企业正在使用独立的产品对部分或全部Kubernetes环境进行保护,导致其保护环境复杂化;有94%的中国企业认为采用集成式解决方案会有好处,但他们并未付诸实践。
所以,是时候与时俱进,摈弃传统思维了。在Kubernetes环境中,所有的资源、诸多命名空间之间是不可交叉的,由一个总控平台进行组织,下面的集群包含几十、上千个命名空间。而在业务中,也是一层一层往下去看,一个业务基于几个或者上千个命名空间,每个命名空间底下又有不同的资源,其复杂性远超过去的虚机。这其中但凡有一个资源遗漏,业务就无法恢复。
要想保护好这样的业务,就必须以业务的视角梳理保护方案,把其中复杂的层级作为一个业务整体进行保护。只有作为整体进行恢复,才能保证业务的顺利恢复。
基于“统一保护”的思路,我们给企业的建议如下:
建立以应用为中心的保护:以应用角度为核心进行数据保护,针对所有命名空间、资源进行不同级别的完整、一致性保护;
构建平台思维: 基于现有的企业整体环境,不仅是Kubernetes环境,还包括其他所有的环境,构建起整体环境下的统一、一致性的备份平台;
简化运维:通过自动化的方式解放DevOPs团队和备份团队的工作量;
灵活恢复:包括细粒度恢复、集群恢复、单个配置文件的恢复、能够恢复到不同的目标端、迅速回滚等等,以及网络安全的应对;
广泛支持容器平台和容器存储:不仅是对容器本身运行的环境广泛支持,还包括容器恢复时平台和版本的支持。
多云时代下,每个企业都不可避免的遇到“4C”挑战(即云、网络威胁、合规和成本)。现实是企业的数据管理能力远没有跟上数字化转型的速度,这中间的差距正是滋生不安全因素的温床。虽然任重道远,但这并不是无解的难题,只要拥有平台思维,建立统一的、全方位数据保护策略,相信企业都能逐一攻破数据保护难关,在数字化转型中独占鳌头。
关于Veritas
Veritas Technologies是多云数据管理领域的领导者。超过八万家企业级客户, 包括 87%的全球财富 500强企业,均依靠Veritas确保其数据的保护、可恢复性和合规性。Veritas在规模化的可靠性方面享有盛誉,可为企业提供抵御勒索软件等网络攻击威胁所需的弹性。Veritas通过统一的平台,支持超过800种数据源,100多种操作系统,1400多种存储设备以及60多类云平台。在云级技术的支持下,Veritas现正在实践其自治数据管理战略,在提供更大价值的同时,降低运营成本。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。