互联网高速发展,数据的爆炸式增长,给企业带来更多的发展机遇。但同时也为IT部门带来更多的压力。因为如果发展数据存储系统故障导致数据错误和丢失,可能会给企业带来灾难性的后果。如何在灾难和故障发生的时候,确保数据可用,同时实现业务恢复,实现数据的持续保护?
本文结合火星舱的CDP与HA,谈一谈实现自动与手动容灾接管对于实现业务恢复以及数据持续保护的应用。我们今天讨论的“接管”,所指的是高可用(HA)或者说业务连续性,而不仅仅指存储的恢复。
业务连续性实现方式
我们知道传统意义上的自动接管,需要具备HA双机软件,侦测故障发生并执行切换,通常是在有共享存储的情况下切换服务器。这时存在一个问题,如果共享的磁盘阵列坏了怎么办?尽管有许多双控制器存储号称没有单点故障了,但他们一般最多宣传99.999%的可用性,也就是依然有宕机的可能。就像某国外厂商说的,背板故障也不是没遇到过...
火星舱CDP的手动接管,是在生产存储出现设备故障和数据错误时,将CDP磁盘组挂载到生产服务器或者备用服务器,恢复数据库和/或者应用的正常运行。那么,有没有将CDP连续数据保护与传统服务器双机结合使用的方法呢?答案是肯定的。
但有些灾难和故障发生时,不仅是数据错误或者存储系统的故障,这时用户除了确保数据可用之外,还要考虑如何恢复业务。
HA考虑因素:备机与共享存储
这里用户应该根据自己的实际情况来部署,首先考虑的因素是备机:是选择物理服务器、专用的虚拟化容灾服务器(外部),还是火星舱内置的虚拟机。
选择物理服务器、专用的虚拟化容灾服务器其性能和可用性都是最好的,但成本投入也比较大;虚拟化可以做多对一的业务接管,设备的利用效率提高,可能需要购买虚拟化软件许可;而采用火星舱,不用投入单独的设备,火星舱内置虚拟机会分享火星舱本身的硬件资源,但是性能上会受一定的限制。最重要的是用户根据自己的情况来选择适合自己的场景。
另一个考虑因素,如果做服务器双机HA自动接管,是否有共享存储也是一个需要考虑的问题。
如果是“双机单柜”,在增加了火星舱CDP之后就是“双机双柜”了,当故障切换发生时备机第一时间接替对生产存储——共享磁盘阵列的访问,同样连接两台主机的CDP磁盘组也要切换过去,同时备用服务器上安装的镜像代理程序要无缝接管写入拆分的任务,继续保持火星舱与生产存储之间的数据同步。
当生产服务器的故障修复后,火星舱CDP保护任务,还能随着两套存储的“回切”而一并切回至生产主机。
要是没有共享存储呢?如果应用数据位于生产服务器内置硬盘(通常也做了RAID),服务器宕机后上面的数据也无法访问了,此时服务器切换的HA软件会将备用服务器连接的“共享盘”指向CDP磁盘组,这样就相当于火星舱CDP完成了数据同步复制的工作。
在成本有限、业务压力相对不高的情况下,如果采用火星舱虚拟机作为备机,CDP+HA方案加上生产服务器一共只需要两台设备。这时虚拟机到CDP磁盘组的连接可在设备内部直接高效实现。
最后,谈谈数据块级同步CDP,在双机HA + 数据容灾方案中的优势。
首先,火星舱CDP可以保护任何块存储设备,也就是操作系统中可以看到的任何磁盘。包括外部连接的FC SAN、iSCSI还是DAS存储,也可以是服务器机箱内的单个硬盘或者RAID卡配置的阵列。对于后者这一点,磁盘阵列厂商的同步镜像/复制是无法解决的。
其次,对于许多文件级CDP和基于日志的异步复制方案,通常是定时传送变化数据,或者先临时保存在本地暂存区。这时一旦生产存储不可访问,CDP备用设备上的数据与生产数据之间会有一个差异量。也就是说在切换时很可能会丢数据!
而火星舱则不存在上述的问题,这就是我们在前两篇文章中曾经介绍过的“RPO=0”和“块级同步保护”。
好文章,需要你的鼓励
法国人工智能公司Mistral AI宣布完成17亿欧元(约20亿美元)C轮融资,由荷兰半导体设备制造商ASML领投。此轮融资使Mistral估值从去年的60亿美元翻倍至137亿美元。英伟达、DST Global等知名投资机构参投。作为欧洲领先的AI开发商,Mistral凭借先进的多语言大模型与OpenAI等美国公司竞争,其聊天机器人Le Chat具备语音模式等功能。
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
VAST Data收购了成立仅数月的初创公司Red Stapler,该公司由NetApp资深团队创立。Red Stapler创始人兼CEO Jonsi Stefansson将担任VAST云解决方案总经理,负责超大规模云战略。Red Stapler拥有6名开发人员,开发了跨SaaS交付、API集成、监控等功能的云控制平面和服务交付平台,将加速VAST AI OS在超大规模和多云环境中的部署,深化与全球领先超大规模云服务商的合作关系。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。