在国内的一些企业、政府机构招标采购数据备份软件/设备的参数规格要求中,有时会看到以下这样的描述:
“支持远程备份,采用多主控模式,各主控能独立工作;支持断点续传、双向缓冲、压缩、流量控制、加密等有效的广域网数据备份技术,减少网络通信流量,提高数据传输的稳定性和高效性。”
远程备份,属于数据保护技术中的一种异地容灾高级功能。上述文字中对远程备份的一系列技术要求并不是阳春白雪、华而不实的宣传噱头,而是在经历了各种用户项目、遇到真实需求,为了有效解决问题不断发展完善而来的。
首先,什么是多主控模式呢?
在介绍多主控模式之前,首先谈谈一主(master)多从(slave)模式的远程备份架构。所谓主-从模式,即在远程备份或者多个备份服务器节点的环境中,所有任务都是由控制节点来发起的,在数据恢复时也必须有catalog——也就是存放备份目录的数据库才能进行。
一主多从模式的弊端在于,当主控节点出现故障,访问不了catalog的情况下从节点(介质服务器)上的数据也无法恢复。如果是在数据中心内的局部故障,有RAID保护的硬盘,恢复catalog数据还不算太麻烦。如果是做的远程备份,遇到站点级的灾难,要保证远程灾备中心的介质服务器能够恢复,就必须把catalog也传过去。那么有没有一劳永逸的办法呢?
答案就是多主控模式。多主控模式有点像存储里面的复制,也就是对等的节点可以做远程互备,一对多、多对一均可。备份数据和任务“对象”信息在每一个备份服务器(或者一体机)上都是完整的,可以用于在异地直接独立恢复。这样,介质服务器将不再依赖主控节点,也无需单独考虑catalog的远程备份。
下面以在企业级数据保护领域有着超过10年自主研发经验的火星高科开发的火星备份软件/一体机为例,简单介绍一下多主控远程备份能够解决的问题。
上图是备份软件中添加异地主机时的一个界面,首先显示的“您能够添加的异地客户机数”来看,一对多远程备份至少可以做到30个目标。
位置——手工填写备份目标的描述。
IP地址——填写异地装有传输中心的主机(MBA备份服务器或火星舱)的外网IP。
默认磁带池——选择本地存放备份数据的磁带池,可以是物理磁带设备,也可以是磁盘存储虚拟的磁带格式(VTL等)。
压缩级别——可选0-9级,默认为6级。级别越高,压缩效果越好,计算资源消耗相对最大;反之亦然,0级代表无压缩。
设置合理的压缩级别,将能够显著降低远程备份对网络带宽的需求。
重试时间——以分钟为单位设置重试时间范围,在此期间每隔5秒重试连接一次。
在进行远程备份时,如果没有“断点续传”机制,一旦遇到网络中断或者不稳定的情况,很容易造成整个备份任务失败的情况。该功能在国内的WAN网络环境中更加重要,因为线路质量通常没有那么好。
传送时间——允许任务在每天的此时间段内进行传输。
例如可以选择只在线路带宽占用不繁忙的夜间,传输远程备份数据。
速度限制——根据用户的网络带宽填写合适的传输速度,填写“0”为不限制速度。
对远程备份可以占用的带宽进行限制,以保证同一通信线路上的其它正常通信不受影响。
最下面,还有是否加密传输的选项。数据安全在有些领域是个大问题,如果备份数据在远程传输过程中被他人截获,加密处理能够最大限度减低敏感数据泄露的隐患。
正是凭借着以上强大、实用的远程备份功能,火星高科才得以在这些年成功实施了多个大型项目。包括:中国科学院全国12个分院100多个研究所备份项目、国家安监总局“金安”工程25个省级局本地及远程容灾备份项目等等。
国家安监总局“金安”工程25个省级局本地及远程容灾备份项目
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。