对于需要CDP连续备份保护的文件,从理论上说,任何一次的文件数据变化都会被自动记录,因而称之为持续数据保护。由于CDP技术是持续不间断的监控并备份数据变化,故在发生宕机需要进行数据恢复时,数据可以被恢复到过去任意时间点。
虽然CDP技术可以将数据恢复到过去的任意时间点,但不足之处是恢复任意时间点无法保证数据恢复完成后数据库处于一致性状态(数据库一致性是指事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态。保证数据库一致性是指当事务完成时,必须使所有数据都具有一致的状态)。而非一致性状态的数据库运行时有可能造成事务的非正常中断,影响数据正确性,重则破坏数据库,造成数据丢失。
具有专利的一致性快照技术,与数据库结合更好
针对某些应用(如Oracle数据库等),并不是每个I/O记录的状态都是应用数据的一致性点,而非一致性状态有可能造成事务的非正常中断,影响数据正确性,重则破坏数据库,造成数据丢失。火星舱CDP采用数据一致性专利技术(专利号:ZL 2011 1 0270306.5、201310334842.6),专门开发了与应用软件相结合的数据一致性代理程序,生成数据一致性快照恢复点。既能够实现单个I/O记录操作的精细颗粒度,又最大限度保证了复杂应用环境下数据的有效恢复。
火星舱CDP数据一致性快照优势
本发明克服了现有存储技术中无法获取数据库一致性状态的缺点,提供一种Oracle数据库一致性点的捕获方法。该方法能够及时捕获Oracle数据库处于一致性状态时的时间点,当处于CDP状态的Oracle数据库需要进行数据恢复时,可以对照被捕获的一致性状态时间点,将数据库数据恢复到最近的一致性时间点,从而保证数据库处于事务一致性状态。
火星舱CDP的数据库一致性技术,属于被动快照记录点。传统的主动式快照/备份一致性代理,在生成快照点之前需要通知数据库将内存中的临时数据(dirty data)写盘,会影响数据库性能,特别是频繁快照时影响更大。而火星舱CDP的被动式快照生成机制对性能没有影响。
火星舱CDP快照实现原理
本方法可以在Oracle数据库相应事务结束后秒级时间内确定事务的一致性时间点。从而使数据库需要进行恢复操作时,可以依据时间点信息恢复到距当前时间最近的事务一致性点。如表1(捕获的一致性点实例)所示,右侧所列每一个被捕获的时间点处,Oracle数据库均处于一致性状态。
捕获的一致性点实例
同时,由于本方法采用分析数据库内部表方法捕获数据库一致性点,故适用于8.0版本(由于本方法涉及Oracle增量检查点信息,而Oracle从8i开始引入了增量检查点的概念)以上所有版本Oracle数据库,并支持Windows,Linux,Unix等多操作平台下应用。
确定一致性点流程图
对于MS SQL Server数据库等应用,火星舱CDP也能通过类似技术实现方式,获取被动式一致性“快照”点。在保证应用数据能够有效恢复的同时,避免了影响存储I/O的性能。
好文章,需要你的鼓励
亚马逊云服务部门与OpenAI签署了一项价值380亿美元的七年协议,为ChatGPT制造商提供数十万块英伟达图形处理单元。这标志着OpenAI从研究实验室向AI行业巨头的转型,该公司已承诺投入1.4万亿美元用于基础设施建设。对于在AI时代竞争中处于劣势的亚马逊而言,这项协议证明了其构建和运营大规模数据中心网络的能力。
Meta FAIR团队发布的CWM是首个将"世界模型"概念引入代码生成的32亿参数开源模型。与传统只学习静态代码的AI不同,CWM通过学习Python执行轨迹和Docker环境交互,真正理解代码运行过程。在SWE-bench等重要测试中表现卓越,为AI编程助手的发展开辟了新方向。
当今最大的AI数据中心耗电量相当于一座小城市。美国数据中心已占全国总电力消费的4%,预计到2028年将升至12%。电力供应已成为数据中心发展的主要制约因素。核能以其清洁、全天候供电特性成为数据中心运营商的新选择。核能项目供应链复杂,需要创新的采购模式、标准化设计、早期参与和数字化工具来确保按时交付。
卡内基梅隆大学研究团队发现AI训练中的"繁荣-崩溃"现象,揭示陈旧数据蕴含丰富信息但被传统方法错误屏蔽。他们提出M2PO方法,通过改进数据筛选策略,使模型即使用256步前的陈旧数据也能达到最新数据的训练效果,准确率最高提升11.2%,为大规模异步AI训练开辟新途径。