方兴未艾的云计算市场,正在加紧扩张的步伐。可以肯定的是,云的主流趋势正给数据管理和数据保护带来根本性的变革,而从前那些传统备份厂商如何在这个云市场安身立命?作为一家立足于数据和信息管理及保护领域的纯软件厂商,CommVault在成立近20年之际把云作为自己的一个重要发展里程碑。
当前企业正在越来越多地开始部署私有和混合云来提高业务的灵活性,而云端数管理的重要性日益凸显。和传统数据管理不同,云端的数据管理利用的资源方式不同,传统的信息管理利用的资源都是具体的设备和应用,而云的架构是利用网络来提供资源,资源被抽象成为:计算资源、存储资源和应用资源。
CommVault资深系统工程师林晓明认为,云计算和大数据对于数据管理和数据保护提出了三个“新”:首先是新架构,传统的数据保护架构不能满足云计算和大数据要求,必须有新的架构来满足云计算和大数据的数据保护要求;其次是新风险,因为云计算和大数据最大的特点是规模超大,一旦出问题影响不可想象,如何控制风险是十分重要的,必须要满足控制风险的底线;第三是费用,按传统IT模式,PB级数据保护费用巨大,必须要降低费用。
林晓明向记者举例说,某大型电商运营了一个大型云中心,不仅自身很多系统运行在云上面,同时还对外提供云服务。他们需要保护的数据量高达几十PB,还在迅速的增长,因此痛点直指如何保护PB级的数据以及五花八门的应用,和如何快速恢复某一个应用中的数据,需要一个能够在云端高效率管理和保护数据的平台和方案。
来源:IDC《推进第三方平台时代的智能数据管理》白皮书
在这个大背景下,CommVault以自己在数据及信息管理上的定位,向基于云和管理服务的环境过渡,并帮助企业更加轻松有效地实现其数据管理、合规和移动计算的目标。
CommVault的Simpana旗舰平台推出时间较早,“但它自诞生时就具有深远的前瞻性,其分布式的体系架构能很好的满足云和大数据的管理要求,在此基础上,结合云利用资源的新特征,就能非常好的为云和大数据进行服务。”林晓明解释称,这里所说的新特征,体现在虚拟机及数据的生命周期管理、云备份、海量数据备份及归档、内容云搜索。
CommVault软件目前的版本是Simpana 10 解决方案套件,该套件中有许多满足云应用的特点以及方案。不仅能对多种虚拟机系统进行保护,还能支持20多种主流的云存储设备及云存储服务接口。另外CommVault还进一步完善了为客户提供的云服务器平台,通过这个平台,可帮助用户完善并简化运维,比如能在云平台上生成运维分析报告。
当然,现在市场中也不乏做云端数据管理的厂商,大家都希望在这个市场分一杯羹。谈到自身定位,林晓明认为,CommVault最大的优势就是所谓的“一体化”,也就是能在一个平台下完成数据保护、快照管理、数据归档以及内容检索,而其他厂商需要多个产品来完成这些功能。这种一体化能给用户带来的好处也显而易见,部署方便、运维简单、降低总体成本。
在此前接受媒体采访时,CommVault高管曾表示,CommVault在云方面拥有三大先机,首先是云集成和云存储能力,现在已经开始着重做跨不同云平台的工作;其次是CommVault 在全球覆盖力,200多家托管服务供应商方面和CommVault建立了合作伙伴关系; 其三是CommVault在细分市场做了大量投入,不仅在云服务方面的销售成立了专门的团队和项目,还针对云服务合作伙伴提供定价和市场拓展项目。
目前,CommVault的平台支持大多数云存储平台,并新增了面向亚马逊Amazon Web Services和微软Azure的功能,其中包括云端报告以及最终用户自助配置、恢复、软件快照和虚拟机资源管理功能。“CommVault很早以前就认识到了云计算的发展趋势,并在过去7年中在云计算领域进行了大量投资。目前,CommVault是200多家管理服务和云服务提供商的首选供应商。”
除了技术和功能之外,云计算带来的新挑战,让CommVault也在不断调整产品战略,使其更好地满足云的服务器要求,传统的产品许可证基本是按服务器和应用来计算,并采用完全买断的形式,而为了满足云的变化及租赁的特征,CommVault推出了容量许可证模式,按数据量来计算许可证,购买的方式也更加灵活,增加了分期付款方式和订阅方式。
放眼这个生态圈,作为一家纯软件厂商,CommVault对于合作伙伴的重视不言而喻。在云计算方面举例来说,CommVault与微软Azure的合作主要是与云存储空间捆绑销售为主,与Rackspace则注重订阅方式,按照实际使用量来结算,与华为则通过设备和方案的打包合作。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。