近期,创原会在杭州千岛湖成功举办云原生技术精英沙龙,来自云原生计算基金会(CNCF)、中国信通院、华为以及各行业的云原生技术精英们共聚一堂,就云原生与企业业务融合的无限可能进行了深入研讨。
华为云CTO张宇昕在会上指出:“未来,华为云将围绕泛在、计算、调度、网络、数据、智能、应用、安全8大新范式,全面升级云原生产品,构建完整的云原生2.0技术与产品体系。”本次杭州站沙龙主要聚焦泛在、计算、数据三大新范式展开话题研讨,本文将重点讨论数据新范式在云原生方面的创新与实践。
数据新范式:分布式技术与存算分离相结合,构建云原生数据库新姿势
数据新范式研讨环节,华为云数据库业务负责人苏光牛发表重要观点:“云原生是大势所趋,云原生数据库也将是企业上云的首选,而云原生和分布式的结合将是数据库的未来。华为云GaussDB的首要任务就是解决业务的连续性需求,能帮助用户不受任何约束地使用数据库,所以GaussDB的设计初衷就是从自主可控出发,再和云原生技术相结合,通过NDP算子下推技术和PQ并行查询技术打造企业级分布式数据库。”
华为云数据库业务负责人苏光牛
华为云云原生数据库首席架构师彭立勋发表重要主题演讲,分享了GaussDB数据库在云原生方面的创新与实践。彭立勋认为,云原生数据库GaussDB的设计初衷是为了充分利用云基础设施内在的能力,从简单的部署在云上使用云资源的ON CLOUD,到充分跟云基础设施结合长在云上的IN CLOUD,这个能力的实现需要分布式计算与存算分离相结合,同时具备云原生一系列能力,具体如下:
云原生存算分离架构:GaussDB架构的核心就是计算存储分离、层次解耦、多生态兼容。这个架构可以很好解决热点数据问题,以及数据丢失、故障恢复等难题。
云原生系列能力:NDP算子下推与PQ并行处理技术相结合才是分布式数据库的基础,GaussDB基于云原生分布式架构,提供了海量数据存储、分钟级扩展、并行处理、算子下推等云原生能力,面对客户高负载和各种复杂场景,表现更从容。
生态开放:云原生时代,开放生态的数据库将成为企业的首选。华为秉承开放生态的理念,积极开源openGauss内核,鼓励数据库服务商基于openGauss内核进行研发,发行属于自己的商业版本。
华为云云原生数据库首席架构师彭立勋发表演讲
此外,GaussDB还提供了极致弹性、跨AZ一致性访问,以及多元算力软硬协同、智能运维等能力。想让类似梦饷集团等更多的企业走上云原生数据库转型之路,则需要提供更高效稳定、高安全性的方案,确保云上用户的数据安全。
技术是无穷止的,在技术浪潮中找准方向很重要。彭立勋最后提道,极致性价比、全密态数据库、AI自治、商业数据库迁移、Serverless将是GaussDB数据库未来的重点发展方向。
来自梦饷集团的嘉宾分享了使用GaussDB云原生数据库进行业务升级的故事和经验,依托存算分离、极致弹性、强悍性能、数据强一致等技术优势,为梦饷集团数据平台提供了高效分析能力,为业务敏捷开发提供更多保障,为数据库运维提升更高效率,在面临海量数据处理时更敏捷、高效。
梦饷集团嘉宾发表演讲
云原生之路任重而道远,华为云GaussDB始终会聚焦客户业务场景,不断开拓创新,让云原生技术与业务场景结合,携手创原会等云原生交流平台,与各行业企业共同推进云原生技术与产业的发展。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。