在SNIA(全球网络存储工业协会)对CDP的定义,CDP连续数据保护就是在保证主要数据正常运行情况下,实现对变量数据进行跟踪,同时可以恢复到此前任意时间点的方法。一般CDP系统可以提供块级、文件级和应用级的数据保护。
那么就会有人问块级、文件级和应用级备份各自都有哪些特点?用户如何选择适合自身应用的备份方式?以下对它们做些简单的分析。
基于应用:日志级CDP
基于应用CDP系统只针对受保护应用系统,对应用系统资源占用较大。典型的比如Oracle GoldenGate、DataGuard这些基于数据库复制的产品。主要数据传输量较小,比较容易实现双活或者读写分离/备库查询。不容易做到完全同步保护(即RPO=0),由于是通过以太网的IP传输,日志型CDP对应用性能的影响相对明显一些。而且存在一些不稳定的因素,需要用户避免写入冲突的机制,无法防御数据库底层结构的损坏。
基于存储:数据块级和文件级
相比之下,文件级和块级CDP支持的数据类型就更多,除了数据库和文件(结构化和非结构化),可以对操作系统盘的保护(仅限块级保护)。同时,它们在备份目标上可以做到多对一。像火星舱这样的基于数据块保护的存储级CDP产品,其授权主要是针对容量和性能(高转速SAS还是近线硬盘),对于被保护客户端系统数量不限。
文件级CDP
文件级CDP通过监测文件系统层面之上的数据变化,只需要将变量传输到备份节点或者设备。实时或者定时(严格说应该归类为“准CDP”)文件复制实现起来相对简单,但由于基于TCP/IP协议传输,受限于网络带宽及损耗,如果要达到同步对应用系统性能影响会比较大。
文件级CDP还有一个问题,就是像Oracle ASM这样由应用直接建立在裸设备上,绕过文件系统直接管理的磁盘,无法保护。
数据块级CDP
数据块级CDP则没有这些限制,它的数据写入拆分实现位于磁盘驱动层面,在文件系统的下一层。如果是同步保护,就类似于RAID 1的镜像写入,无需磁盘缓冲区或者最多占据很少的内存。在上一篇中我们讲到火星舱的RPO=0和RTO=0就是依赖于数据块级CDP。火星舱除了支持I/O颗粒度的数据回滚——这也是“真 CDP”所要求达到的,当用户部署Oracle ASM、Unix/Linux LVM的情况下,还能实现存储故障的自动连接。
数据块级CDP的一大优势是可以使用FC或者iSCSI存储网络协议,特别是前者。火星舱CDP也充分考虑到了数据一致性,对于Oracle、SQL Server等在这方面有严格要求的应用,火星舱提供了具备专利的一致性快照技术。该技术不同于传统存储的快照,采用被动式机制,感知数据库缓存刷盘的动作并在I/O记录上进行标记。保证了各种应用场合数据的有效恢复。
数据块级CDP在初始同步后也是只向目标设备写入变化数据,但在一个磁盘或者分区较大而其中存放数据的容量比例不大时,初始同步所占的时间,以及一下占用的备份空间太大(达不到精简的效果)。最新的火星舱数据保护系统5.0,在Web管理界面中加入了文件系统解析功能,可以只同步磁盘上被文件系统占用的数据块。这一点,可以说把文件级CDP的优点也结合了进来。
加密数据的保护对于用户在操作系统下对分区进行加密的方式,火星舱能够利用CDP磁盘镜像将所有分区的状态“原封不动”复制出来,当需要访问备份数据时,密码访问口令和解密与被保护的原分区完全相同。这也是数据块级CDP的独有优势,基于文件和应用日志的保护是无法实现的。
总结:基于应用系统实现CDP,只针对受保护应用系统,对应用系统资源占用较大。基于文件系统,写完FAT表后,才开始复制,同时需要先读取数据;消耗大量系统资源突发增加网络带宽;基于数据块,I/O级复制技术,带外旁路(FC/IP SAN),不影响性能,块级别保护,不受OS干预。
好文章,需要你的鼓励
YouTube开始推出肖像检测工具,帮助创作者识别和举报使用其面部特征的AI生成视频。该系统类似于版权检测机制,目前处于测试阶段,仅向部分创作者开放。用户需要提供政府身份证件照片和面部视频来验证身份。系统会标记疑似包含用户肖像的视频,但无法保证100%准确识别AI内容。YouTube将根据多项因素决定是否移除举报的视频。
华中科技大学研究团队发现,通过让AI模型学习解决几何问题,能够显著提升其空间理解能力。他们构建了包含约30000个几何题目的Euclid30K数据集,使用强化学习方法训练多个AI模型。实验结果显示,几何训练在四个空间智能测试基准上都带来显著提升,其中最佳模型达到49.6%准确率,超越此前最好成绩。这项研究揭示了基础几何知识对培养AI空间智能的重要价值。
谷歌宣布在AI Studio平台中引入"氛围编程"体验,让编程和非编程用户都能更轻松地开发应用程序。用户可通过简单提示生成可运行的应用,新功能包括应用画廊、模型选择器、安全变量存储等。平台还添加了模块化"超能力"功能和"手气不错"按钮来激发创意。完成的原型应用可一键部署到谷歌云运行平台。此次更新正值业界期待谷歌即将发布Gemini 3.0大语言模型。
中国人民大学研究团队开发了Tool-Light框架,通过信息熵理论解决AI工具使用中的过度调用、调用不足和过度思考问题。该框架采用熵引导采样和两阶段自演化训练,让AI学会合理使用外部工具。在10个推理任务测试中,Tool-Light显著提升了AI的效率和准确性,为AI工具集成推理提供了新的解决方案。