近日,中国信通院发布了首个大模型混合云标准,通过定位当前大模型混合云的能力水平,为基于混合云的大模型服务实践提供指引,并明确未来提升方向。同时,中国信通院基于标准展开大模型混合云能力成熟度专项测试,其中华为云Stack大模型混合云解决方案顺利完成专项测试的全部内容,在AI-Native云基础设施层能力、模型层能力、应用层能力、安全能力及运营运维能力的评级,达到大模型混合云能力成熟度评估的最高卓越级,华为云成为首批通过测试的企业。

随着人工智能技术的不断突破,行业专属大模型日渐成为政企智能化的主要落地方向。因兼顾数据安全与隐私、训推效率与开发成本,混合云成为行业大模型落地的最优解,正迅速应用在金融、矿山、政务、制造等多个领域。
在此背景下,中国信通院对大模型混合云能力展开研究,从混合云基础设施的异构计算/高性能存储/高速网络等资源对大模型的支撑能力、大模型在混合云上实现包括数据工程、模型开发/训练及模型部署/推理的全流程的能力、大模型针对不同行业/场景的多样化需求的服务丰富度、大模型混合云综合安全能力及运营运维能力五个方面全面衡量大模型混合云技术能力。

大模型混合云能力成熟度框架
华为云Stack发布的大模型混合云解决方案,通过坚实算力底座、使能百模千态、赋能千行万业三大能力,帮助企业一站式建设自己的专属大模型。
• 坚实算力底座:从计算、存储、网络、安全和运维5大维度打造AI-Native云基础设施。在算力层面,通过多样性算力调度和算子加速能力,实现异构算力融合,算力利用率提升50%以上;结合高性能存储的多层缓存机制、高吞吐无阻塞AI网络,让算力发挥最大价值;四道大模型安全防线,可以智能拦截90%新型攻击;打破硬件、模型、应用碎片化的运维体系,实现全链路可观测,故障1分钟发现、10分钟定界、30分钟恢复。
• 使能百模千态:提供ModelArts开发生产线,支持大规模异构集群调度管理、分布式训练、云边协同部署及全流程工作流,并提供模型开发套件、全链路数据工程套件、应用开发套件3大套件,加速数据、模型、应用的一站式开发。同时,华为云Stack原生集成超过30个业界主流的基础模型,实现开箱即用。
• 赋能千行万业:目前,华为云Stack已联合100多个重点伙伴,基于大模型混合云打造丰富的行业大模型场景化方案,应用于政府、金融、煤矿、交通、电力等10多个行业。同时华为云Stack将与政企客户联合创新中的经验和能力固化下来,形成6大阶段30多个专业服务,覆盖大模型从规划设计到建设运营的全流程,让大模型从可用到好用。
今年6月,华为云Stack发布大模型混合云十大创新技术,通过聚焦根技术突破,帮助政企客户抓住大模型战略机遇,加速迈向智能世界。

面向未来,华为云Stack将以坚定的战略耐心,持续深耕根技术,打造更优的大模型底座和基础能力;并深入行业场景,通过工具和专业服务使能懂行的生态伙伴,与客户、合作伙伴共同探索更多大模型与行业结合的创新路径,共迎AI的黄金时代。
好文章,需要你的鼓励
亚马逊云服务部门与OpenAI签署了一项价值380亿美元的七年协议,为ChatGPT制造商提供数十万块英伟达图形处理单元。这标志着OpenAI从研究实验室向AI行业巨头的转型,该公司已承诺投入1.4万亿美元用于基础设施建设。对于在AI时代竞争中处于劣势的亚马逊而言,这项协议证明了其构建和运营大规模数据中心网络的能力。
Meta FAIR团队发布的CWM是首个将"世界模型"概念引入代码生成的32亿参数开源模型。与传统只学习静态代码的AI不同,CWM通过学习Python执行轨迹和Docker环境交互,真正理解代码运行过程。在SWE-bench等重要测试中表现卓越,为AI编程助手的发展开辟了新方向。
当今最大的AI数据中心耗电量相当于一座小城市。美国数据中心已占全国总电力消费的4%,预计到2028年将升至12%。电力供应已成为数据中心发展的主要制约因素。核能以其清洁、全天候供电特性成为数据中心运营商的新选择。核能项目供应链复杂,需要创新的采购模式、标准化设计、早期参与和数字化工具来确保按时交付。
卡内基梅隆大学研究团队发现AI训练中的"繁荣-崩溃"现象,揭示陈旧数据蕴含丰富信息但被传统方法错误屏蔽。他们提出M2PO方法,通过改进数据筛选策略,使模型即使用256步前的陈旧数据也能达到最新数据的训练效果,准确率最高提升11.2%,为大规模异步AI训练开辟新途径。