随着技术的不断发展,云计算已经不再是停留在口号中的噱头,云的建设已经逐渐的真实落地到众多大型企事业单位的IT基础架构建设中。根据ESG发布的一项针对云的调查显示,60%的终端用户表示目前正在使用云或是在部署云战略。而备份和灾难恢复服务则是云计算领域一个重要的组成部分。然而,在IT预算日益缩紧的今天,云灾备确实可以成为一个灾难恢复计划的最佳选择。某大型国企财务公司就是这样,走在了云灾备建设的前端。
某大型国企财务公司是隶属于某大型国企集团公司的非银行金融机构,主要为集团公司提供贷款、票据贴现、代理开证、委托贷款、票据签发、担保等金融服务。截至2011年末,公司资产规模超过430亿,成立10余年来,已经建立起一套具有自身行业金融特点、完整的业务体系。
经过多年的IT建设,大型国企财务公司的IT系统已经非常的庞大而且复杂,单是IT基础架构就包括了Oracle, SQL、Web、VCS集群、VMware,同时操作系统也基本涵盖了当前所有主流的操作系统平台,后端存储更是由多个主流厂商的存储硬件支持着不同的前台业务。
按照集团公司与银监局等上级监管机构的相关要求,同时,为了完善公司信息化建设,消除现有信息化整体规划建设中没有异地容灾备份系统的缺陷,必须为公司的核心业务系统建立应用级异地容灾备份系统,即要保障核心业务系统数据的安全性和连续性,也要确保核心生产系统环境在出现各种故障时,均能够快速有效的应对。而国企财务公司复杂的IT系统架构给灾备建设提出了不少严苛的需求难题,包括:
l 目前架构的RTO和RPO太低
l 无法承受数据迁移带来的耗时和风险
l 存储异构,且有大量本地盘,希望同时获得全面保护
l 对大量未配备HA的系统和虚拟服务器,要求提供操作系统保护恢复方案,必须具备分钟级恢复速度
l 现有带宽难以实现异地灾备
l 容灾端设备难以利用造成投资浪费
经过严格的方案筛选和技术测试,用户最终选择利用飞康NSS存储虚拟化技术来实现数据迁移、异构整合,并最终实现异地容灾的目的。对于利用飞康NSS建立灾备系统,用户是提出了非常严格的要求的:数据备份与恢复系统在进行自身升级、停用、故障时,不能影响核心应用环境的可用性;可随时验证备份数据的完整性和可用性,验证过程不影响核心应用环境的性能和可用性。
飞康NSS是飞康公司2006年便已推出市场的存储虚拟化产品,它不仅可以基于自己全面开放的存储虚拟化平台提供异构存储整合,帮助用户彻底摆脱厂商锁定的困境,还可以提供零风险的数据迁移,使用户的数据可以在不同品牌的既有存储、新存储,甚至云之间自由移动,同时,数据迁移过程中,应用服务器完全不需要停机,数据丢失和损坏的风险完全消除,也不会影响用户数据一致性。最重要的是,飞康NSS同时提供了与飞康CDP技术一样的高精度的数据保护与灾难恢复/远程容灾能力,使用户在充分利用存储虚拟化技术的同时,同样享有了最高阶、最全面的灾难恢复能力。
与既有环境全面快速对接
飞康NSS在接入生产环境时采用映射(SED)的方式来接管原有存储,无需任何迁移过程,因此与生产环境对接简单快速,且对既有数据无风险。对于仅有本地盘的设备,以及所有的操作系统盘,飞康NSS通过轻量数据代理对磁盘实现实时保护,以保证所有系统和数据都能被纳入保防范围。
强大的逻辑故障防御能力,快速全面的恢复手段
飞康NSS方案的恢复手段极其灵活,仅需一套简单的操作流程,即可支撑任意灾难和故障的快速修复需要。无论是应对数据丢失破坏、存储设备损坏、还是主机瘫痪停机,修复时间均可由传统方案的数小时至数十小时,瞬时缩减为当前的几分钟甚至0。通过对IO生成快照和日志,为生产数据提供了一个高精度快速恢复手段,能在数分钟之内提取回任意时间点的数据,具无需额外存储空间。
最终,由飞康NSS为用户搭建起的存储虚拟化灾备系统,为国企财务公司带来了众多效益:
l 系统全部接入,获得全面保护,只有本地盘的系统
l 能为所有数据(包括操作系统)提供实时持续在线地保护,SAN、iSCSI、以及大量的本地盘,匀可获得高等级保护。
l 为数据提供全面的灾难防御能力,应付任意故障时均能提供快速修复生产的手段
l 实现实时持续的数据保护,发生任意故障时均能支持在10分钟内重建生产
l 专利传输技术,对容灾复制带宽的需求缩减至需原方案的1/50(10M)
l 财务报表和商业分析均在容灾端进行,充份利用容灾端资产,释放生产端资源
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。