ExaGrid的快速发展提醒我们,Data Domain单凭自身拥有的一切还不足以彻底称霸重复数据删除磁盘备份业务市场。ExaGrid的4.9版本设备软件能够将全局重复数据删除机制拓展到向外扩展GRID当中的全部NAS及设备当中,同时还能够实现并行方式的甲骨文数据库备份工作。
全局重复数据删除意味着客户能够随时将备份负载重新指向至任意设备之上的任意共享NAS处,且不会对整体GRID之上的全局数据重复数据删除机制造成任何影响。对于任何给定备份任务,其还能够提高潜在数据压缩比率,进而降低保存备份数据所需要的存储容量。
这款软件的4.9版本同时支持甲骨文RMAN通道;它们可被用于备份最高达800 TB的甲骨文数据库,并向多台共享设备/NAS同时写入以实现更为出色的备份与故障转移性能。RMAN通道会自动以并行方式向全部共享NAS写入“section”,同时自动根据当前可用目标对下个“section”的写入操作进行重新指向。
· 如果任何GRID设备出现故障,这些section会自动被重新指向至活动设备处。
· 最新的数据库内容会以非重复数据删除形式被存储在ExaGrid设备的“landing zone”当中,由于保持原有结构、其恢复速度也将得到进一步提高。而全部长期保留数据则仍然以重复数据删除形式保存。
· 随着数据库数据量的不断增加,备份窗口可以通过向GRID内添加设备并在容量中增加计算资源的方式保持处理能力的同步提升。
Grow Financial公司备份及恢复系统管理员Dave Lively在评论ExaGrid时表示:
我们过去使用的是EMC Data Domain。其在执行基础性备份工作时表现出色,但在恢复方面却显得比较无力。
在99%的情况下,我们需要从最近保存的备份副本当中进行数据恢复。但在EMC Data Domain当中,保存数据必须首先经过重新构建,而这一恢复过程既漫长又复杂。
ExaGrid的GRID架构允许我们通过将设备添加至向外扩展GRID中的方式,根据实际需要对现有系统进行扩展。
另外,ExaGrid事实上会以非重复数据删除形式保存最新备份数据,从而使恢复速度更上一层楼——因为我们能够立即从该系统的landing zone当中访问数据。
ExaGrid-Veeam加速数据迁移概念示意图
ExaGrid公司还提醒我们称,目前已经有超过700家客户在使用ExaGrid与Veeam备份软件这一组合,其中大部分使用ExaGrid-Veeam加速数据迁移软件。这是一套由Veeam与ExaGrid联合开发而成的方案,相当于以ExaGrid设备为基础将Veeam数据迁移引擎整合于其上。
这样一来,其就能够实现与Data Domain Boost类似的加速功能,但又不会像Boost那样在备份过程中对数据进行预重复数据删除处理。根据ESG实验室给出的测试结论,这套方案能够将Veeam的备份性能提高近一倍,而Veeam的整体运行性能更是可提高至六倍。
甲骨文RMAN则提供与Data Domain Boost的集成方案。
目前ExaGrid 4.9版本软件已经以免费方式向年度维护及技术支持客户开放,而且应该会在2015年8月底正式投放市场。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。