如今,越来越多企业在云中运行应用,其中不乏任务关键型的Tier 1应用。无论IT架构还是管理人员,都不得不面临这样的灵魂拷问:如何确保业务技术在云中运行时具备高可用性,并按要求执行,满足业务目标预期?
要回答这个问题,企业IT首先必须明确:确保云中应用程序在线并正常工作,责任主体是自己而不是云供应商。初始默认状态下,应用程序在云中运行时并不会具备高可用性、扩展性和弹性,IT需要自己构建并实现相关功能。
哪些云中责任是需要企业独自承担的?
云供应商有几种方法,可为其提供的服务构建容错能力。企业要想确保任务关键型应用在云中高可用,就必须了解云供应商是如何管理容错的,并且清楚云服务在什么情形下可能失效。在云责任共担模型中,云供应商和企业分别负责不同的部分,即“云供应商负责提供集成弹性和容错能力的服务以防止故障;企业自己负责管理应用程序,确保其具有高可用性并防止故障。”
在云中,无论基础架构(硬件、网络、设施),还是软件(管理和数据平面),任何类型的故障都可能导致应用程序不可用,对业务产生重大影响。这种情况下,企业将不得不实施故障转移,或寻求其他解决方法。谨记:企业在云中运行的应用程序发生停机或性能下降的状况时,并不一定是因云服务商发生故障或服务中断导致,二者并没有必然的联系。
大多数云供应商的IaaS产品都提供可选项,帮助用户将一定程度的弹性嵌入到云环境中:
· 在可用区或区域模型中可部署基础架构,有助于保护其免受局部故障的影响。
· 监控服务,这些服务可以提醒用户故障,并帮助了解系统和服务何时可能降级。
但无论如何,云中应用程序的可用性和弹性如何构建、水平如何等一系列问题仍完全取决于最终用户。
云应用高可用和弹性设计
关于如何为云应用设计高可用和弹性,Veritas建议企业从以下几个关键事项出发重点考虑:
1.清楚地了解可以承受的停机时间;
2.聚焦应用程序所支持的业务服务,设计可满足最低业务需求的高可用方案,以便在主(活动)应用程序发生故障时及时接管;
3.寻找具备可见性和修复功能的解决方案,适用于故障概率最高的云服务(如网络或计算实例故障);
4.在辅助环境(第二站点)中定期测试应用程序和系统,验证弹性策略的有效性;
5.自动化的高可用和灾难恢复操作可以显著提高应用程序正常运行时间,提升整体运营效率。
Veritas + AWS = 高可用与韧性的“集大成”方案
Veritas覆盖所有AWS存储用例,帮助企业时刻确保数据安全、合规且可用。随着不良行为者的攻击越来越复杂,对企业而言,有能力随时通过主动灾难恢复、全自动工作负载迁移、故障转移及进出AWS的故障恢复进行备份变得至关重要。
以SAP环境为例,通过安全全面的云数据管理平台——Veritas Alta,企业在将关键业务工作负载顺利迁移至AWS的同时,可有效确保云中应用程序的可用性、性能、可扩展性,同时简化数据保护,因地制宜地支持恢复作业。
而在正在召开的亚马逊云科技中国峰会上,Veritas也将深度阐释如何确保云中应用的高可用性,并分享更多关于云中数据保护与管理的“干货”,敬请期待!
关于 Veritas
Veritas Technologies是多云数据管理领域的领导者。超过八万家企业级客户, 包括95%的全球财富100强企业,均依靠Veritas确保其数据的保护、可恢复性和合规性。Veritas在规模化的可靠性方面享有盛誉,可为企业提供抵御勒索软件等网络攻击威胁所需的弹性。Veritas通过统一的平台,支持超过800种数据源,100多种操作系统,1400多种存储设备以及60多类云平台。在云级技术的支持下,Veritas现正在实践其数据自治战略,在提供更大价值的同时,降低运营成本。
Veritas中国官方网站 https://www.veritas.com/zh/cn/
Veritas官方微信平台:VERITAS_CHINA(VERITAS中文社区)
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。