全球移动通信行业又迎来了一年一度的技术盛宴——2月26日,2024世界移动通信大会(MWC)在西班牙巴塞罗那会展中心举行。
作为全球规模最大、最具影响力的移动通信展览会,MWC 2024以“Future First(未来先行)”为主题,向全球展示从5G、人工智能(AI),到智能手机和基站天线等一系列行业前沿技术,吸引了多个国家的运营商、行业组织、媒体嘉宾代表出席,超过300家中国企业参与并在5G-A、人工智能(AI)和大模型等热门领域占据主导地位。
其中,移动云携算网大脑、智算中心等前沿科技成果亮相,一展云计算国家队的风采,向世界昭示中国的数智力量。
打造算力网络智能中枢——算网大脑
依托自主可控的技术架构、得天独厚的网络资源,移动云打造中国移动算力网络智能中枢——算网大脑,并实现全网试商用。通过融合人工智能、大数据等技术,算网大脑实现了算网资源的统一编排、调度,优化业务体验和资源使用;首创分钟级算网融合调度算法,可支撑每分钟数万次、每天上千万次的算力调度。
凭借强大的智能编排调度能力,算网大脑支撑了多样化的算网业务,包括任务式服务、一体化解决方案和传统产品升级。
任务式服务是区别于传统资源式服务的一种新型服务模式,以数据快递为例,算网大脑基于端到端网络弹性能力,实现海量数据跨域的稳定传输,目前已成功应用于太湖之光超算中心的数据传输业务,实现了3小时4T数据的稳定传输,通过分钟级弹性计费,降低上云成本12%。
面向工业、医疗、交通等行业,算网大脑可协助用户打造一站式解决方案,提升方案交付能力,多产品组合订购及解决方案的上线效率提升400%。
此外,在传统产品升级方面,算网大脑的作用主要体现在对配置的简化和体验的提升,例如漫游云电脑可以随着客户移动,动态调整实例位置。
布局“N+X”智算资源 引领数字新基建
在AI大模型加速发展的背景下,中国移动紧跟智算产业发展趋势,持续升级智算基础设施建设,构建“N+X”智算资源布局体系。其中,作为在建的全球运营商最大单体智算中心,中国移动呼和浩特智算中心AI算力总规模达5.5EFLOPS(FP16),入选“2023年度央企十大超级工程”,为人工智能创新发展夯实算力基础。
基于智算中心底层万卡高性能算力资源,移动云构建了从高性能算力到AI训练推理平台到模型服务的全栈智算产品体系。
据介绍,在基础设施层,移动云打造万卡级异构GPU集群,具备训练加速、多级资源感知调度、AI工作全链路监控等核心能力,为大模型训练及推理提供高效、弹性的云原生算力;同时,移动云还为用户提供训推一体化模型开发平台,支持断点续训、万卡并行训练,分布式推理可跨20+地域;并提供跨平台的模型迁移工具,解决训练和推理AI加速卡体系不一致问题。
不仅如此,在模型服务方面,中国移动推出九天·众擎基座大模型、九天·海算政务等行业大模型服务,提供100+行业领先的SOTA模型,具备大模型承载和运营能力,为千行百业提供智能化服务。
通过不断探索融合云计算与AI技术,移动云正充分展现出在算力网络建设方面的创新性与引领性。本次移动云的参展,在向世界展示中国品牌科技力量的同时,也表示中国的科技创新与世界的联系正在日益加深。相信,未来移动云将继续强化算网融合优势,积极打造全球性“数字经济”的基础底座,朝“全球一流的云服务商”的目标迈进。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。