我们知道企业级备份软件或者备份一体机支持对文件、数据库和操作系统的保护功能,那么对于文件、数据库和操作系统的保护在技术实现上有哪些差别呢?本文将对文件、数据库和操作系统的保护这些备份基础知识进行介绍,希望能够帮助读者多了解一些备份相关知识。
文件:完全、增量和差异备份
对普通文件的备份,企业级的传统定时备份技术通常会将数据打包成某种格式存放。类似把生产存储上选定的文件、文件夹/目录结构复制到备份介质存储。
对于文件备份,目前几乎绝大多数的备份软件,除了完全备份之外,都能支持增量备份和差异备份(或称差分备份)。所谓增量备份,就是在上一次全备份或者增量备份的基础上,扫描数据源端新增/改变/删除的对象,并对这些变化数据进行备份;恢复时也是按照全备份——增量备份的顺序来进行。而差异备份,则每次都是以上一个全备份为基础进行比对,会占用更多地空间,但恢复时也减少了按顺序依次恢复增量备份的繁琐。
数据库:如何实现备份数据的一致性
数据库备份就没这么简单了。首先,需要保证控制文件、数据文件和日志在时间上的一致性。一般的数据库在设计时为了提高存储的性能,不一定是每条记录的写入操作都会立即保存到硬盘上,比如Oracle默认就是每隔3秒刷新写缓存中的数据到磁盘。如果在这期间出现断电等异常情况,则靠日志来恢复事务的完整性。那我们在备份时,肯定希望是在数据文件和日志文件完全一致的情况,也就是Flush动作刚执行完的状态,此时可以保证数据库的正常可用。数据库备份代理的一个重要功能就是在执行备份前通知数据库将内存中的“脏数据”写盘。
大多数情况下,备份软件是通过调用数据库自身的API或者命令来实现这一点的。以火星高科的MBA(火星舱上的备份功能也是用的这款软件)为例,对Oracle数据库备份支持调用RMAN和导入/导出(import/export)两种方式。RMAN是Oracle自身的备份/恢复程序,支持基于归档日志的增量备份,易用性较好;导入/导出方式相对更加灵活,支持单表操作,但不支持增量备份,操作也相对复杂。对于高级用户,还提供了备份前脚本和备份后脚本的支持。
操作系统:启动相关数据和恢复引导介质
对于操作系统备份,并不是简单地把文件都拷贝一份那么简单,用过ghost等磁盘克隆软件的用户都应该理解。首先,对打开文件的访问支持是个基础条件——有些被OS占用的系统文件需要备份;另外,还有MBR主引导记录/启动扇区,或者GPT格式的启动分区(就像我们安装Windows Server 2008/Windows 7时自动创建的100MB分区),Linux通常也建议有一个100MB左右的boot分区,这些都需要被正常的备份和恢复才能保证操作系统的启动。
企业级备份与普通桌面备份在恢复时的重要一点区别是:桌面备份有些是从本地硬盘、移动硬盘或者光盘来恢复;而企业备份都是要通过网络访问备份服务器、备份一体机乃至FC光纤/SAS连接的磁带(包括虚拟磁带库)设备来恢复数据。因此后者需要一个专用的引导介质,它们可能是基于WinPE和Linux的LiveCD定制的程序。即使是裸机恢复,到一个空白的硬盘,甚至是在另一台服务器上也能正常进行(异机恢复)。
综合来说,数据备份的可靠性不依赖于生产存储和被保护服务器的正常运行,也就是在需要的时候可以做异机恢复。对于火星舱数据保护系统来说,除了传统的定时备份之外,通过CDP(持续数据保护)和SAN Boot技术还能够实时备份、更加快捷地恢复操作系统运行。
好文章,需要你的鼓励
机器人和自动化工具已成为云环境中最大的安全威胁,网络犯罪分子率先应用自动化决策来窃取凭证和执行恶意活动。自动化攻击显著缩短了攻击者驻留时间,从传统的数天减少到5分钟内即可完成数据泄露。随着大语言模型的发展,"黑客机器人"将变得更加先进。企业面临AI快速采用压力,但多数组织错误地关注模型本身而非基础设施安全。解决方案是将AI工作负载视为普通云工作负载,应用运行时安全最佳实践。
MBZUAI研究团队发布了史上最大的开源数学训练数据集MegaMath,包含3716亿个Token,是现有开源数学数据集的数十倍。该数据集通过创新的数据处理技术,从网页、代码库和AI合成等多个来源收集高质量数学内容。实验显示,使用MegaMath训练的AI模型在数学推理任务上性能显著提升,为AI数学能力发展提供了强大支撑。
面对心理健康专业人士短缺问题,谷歌、麦肯锡和加拿大重大挑战组织联合发布《心理健康与AI现场指南》,提出利用AI辅助任务分担模式。该指南构建了包含项目适应、人员选择、培训、分配、干预和完成六个阶段的任务分担模型,AI可在候选人筛选、培训定制、客户匹配、预约调度和治疗建议等环节发挥作用。该方法通过将部分治疗任务分配给经过培训的非专业人员,并运用AI进行管理支持,有望缓解治疗服务供需失衡问题。
这项由多个知名机构联合开展的研究揭示了AI系统的"隐形思维"——潜在推理。不同于传统的链式思维推理,潜在推理在AI内部连续空间中进行,不受语言表达限制,信息处理能力提升约2700倍。研究将其分为垂直递归和水平递归两类,前者通过重复处理增加思考深度,后者通过状态演化扩展记忆容量。