5月17日,腾讯集团副总裁蒋杰在腾讯云生成式AI产业应用峰会上表示,腾讯混元大模型经过持续迭代,目前整体性能居国内第一梯队,部分中文能力追平GPT-4。

腾讯集团副总裁 蒋杰
自2023 年 9 月首次亮相以来,腾讯混元大模型不断探索最新技术,已拓展至万亿规模,并在国内率先采用混合专家模型(MoE) 结构,带来模型总体性能的升级,相比上一代Dense模型提升50%。此外,针对不同场景需求,腾讯混元在中小型模型方面同样积极部署,研发了1B、3B、7B、13B等不同参数量下的 Dense 和 MoE 模型。
在多模态能力方面,腾讯混元大模型也取得不少成果。在生图领域,腾讯混元文生图基础架构已全面升级至 sora 同款的 DiT 架构,支持中英文双语输入及理解,具备多轮绘图能力,测评结果国内领先;在生视频领域,腾讯混元支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力,视频生成长度可达 16秒;在生3D层面,腾讯混元已布局文/图生3D,单图仅需30秒即可生成3D模型。
据了解,这些模型能力将通过腾讯云API对外开放,以满足企业客户及开发者在不同场景下的模型需求,让大模型能力真正落地到产业应用中。在腾讯云上,混元大模型提供了万亿参数hunyuan-pro、千亿参数hunyuan-standard以及百亿参数的hunyuan-lite等多种尺寸的模型服务,其中 hunyuan-standard 模型具备 256k 的超长上下文理解能力,单次处理字符数超过38万个。
会上,蒋杰宣布腾讯混元大模型将坚定拥抱开源,为技术社区生态繁荣贡献力量。目前,腾讯混元文生图大模型已全面开源,开源 3 天内就在Github上获得超千位开发者关注。未来,多种尺寸的腾讯混元MoE模型也将对外开源,可分别支持手机端、PC端、云/数据中心等多样化的部署场景。
蒋杰还宣布,腾讯混元将上线一站式AI智能体创作与分发平台“腾讯元器”,开启智能体生态。在平台上,用户不仅可以在创建专属AI智能体,使用腾讯官方的插件和知识库,还能将这些智能体一键分发到QQ、微信客服、腾讯云上。
蒋杰表示,为更好地为用户提供服务,基于混元大模型打造的C端助手App腾讯元宝也将于5月30号发布。
作为实用级的大模型,目前,腾讯混元大模型已在600多个腾讯内部业务和场景中落地测试,并在腾讯丰富的生态中持续迭代能力。
微信读书基于混元大模型推出了AI问书、AI大纲等新功能,以提升用户的阅读效率和体验。腾讯客服团队基于混元大模型升级智能客服体系,独创智能客服垂直领域精调模型,大幅提升智能对话的意图理解准确性和多轮问答流畅性,相比传统小模型下文准确性提升了38%;腾讯客服还基于混元大模型打造了人工客服助手,帮助客服推荐解决方案,提升服务效率,已在多个游戏客服场景应用,日均用户请求量达到150万次。
此前,腾讯广告基于混元推出了一站式AI广告创意平台——腾讯广告妙思,助力广告生产及投放效率提升,其中图生图平均点击通过率提升15%。腾讯会议基于混元推出的AI小助手,可即时回答会议内外问题,大幅提升开会效率,过去四个月,腾讯会议AI小助手的每日调用量增长了20倍。企业微信、腾讯会议、腾讯文档等腾讯旗下协作SaaS产品,也已全面接入腾讯混元。
蒋杰表示,在大模型这条“全球最卷”的赛道上,腾讯混元始终坚持技术初心和应用导向,将长期持续学习和迭代,也希望能为行业做出更有价值的模型、更好的应用以及更好的服务。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。