5月17日,腾讯集团副总裁蒋杰在腾讯云生成式AI产业应用峰会上表示,腾讯混元大模型经过持续迭代,目前整体性能居国内第一梯队,部分中文能力追平GPT-4。
腾讯集团副总裁 蒋杰
自2023 年 9 月首次亮相以来,腾讯混元大模型不断探索最新技术,已拓展至万亿规模,并在国内率先采用混合专家模型(MoE) 结构,带来模型总体性能的升级,相比上一代Dense模型提升50%。此外,针对不同场景需求,腾讯混元在中小型模型方面同样积极部署,研发了1B、3B、7B、13B等不同参数量下的 Dense 和 MoE 模型。
在多模态能力方面,腾讯混元大模型也取得不少成果。在生图领域,腾讯混元文生图基础架构已全面升级至 sora 同款的 DiT 架构,支持中英文双语输入及理解,具备多轮绘图能力,测评结果国内领先;在生视频领域,腾讯混元支持文生视频、图生视频、图文生视频、视频生视频等多种视频生成能力,视频生成长度可达 16秒;在生3D层面,腾讯混元已布局文/图生3D,单图仅需30秒即可生成3D模型。
据了解,这些模型能力将通过腾讯云API对外开放,以满足企业客户及开发者在不同场景下的模型需求,让大模型能力真正落地到产业应用中。在腾讯云上,混元大模型提供了万亿参数hunyuan-pro、千亿参数hunyuan-standard以及百亿参数的hunyuan-lite等多种尺寸的模型服务,其中 hunyuan-standard 模型具备 256k 的超长上下文理解能力,单次处理字符数超过38万个。
会上,蒋杰宣布腾讯混元大模型将坚定拥抱开源,为技术社区生态繁荣贡献力量。目前,腾讯混元文生图大模型已全面开源,开源 3 天内就在Github上获得超千位开发者关注。未来,多种尺寸的腾讯混元MoE模型也将对外开源,可分别支持手机端、PC端、云/数据中心等多样化的部署场景。
蒋杰还宣布,腾讯混元将上线一站式AI智能体创作与分发平台“腾讯元器”,开启智能体生态。在平台上,用户不仅可以在创建专属AI智能体,使用腾讯官方的插件和知识库,还能将这些智能体一键分发到QQ、微信客服、腾讯云上。
蒋杰表示,为更好地为用户提供服务,基于混元大模型打造的C端助手App腾讯元宝也将于5月30号发布。
作为实用级的大模型,目前,腾讯混元大模型已在600多个腾讯内部业务和场景中落地测试,并在腾讯丰富的生态中持续迭代能力。
微信读书基于混元大模型推出了AI问书、AI大纲等新功能,以提升用户的阅读效率和体验。腾讯客服团队基于混元大模型升级智能客服体系,独创智能客服垂直领域精调模型,大幅提升智能对话的意图理解准确性和多轮问答流畅性,相比传统小模型下文准确性提升了38%;腾讯客服还基于混元大模型打造了人工客服助手,帮助客服推荐解决方案,提升服务效率,已在多个游戏客服场景应用,日均用户请求量达到150万次。
此前,腾讯广告基于混元推出了一站式AI广告创意平台——腾讯广告妙思,助力广告生产及投放效率提升,其中图生图平均点击通过率提升15%。腾讯会议基于混元推出的AI小助手,可即时回答会议内外问题,大幅提升开会效率,过去四个月,腾讯会议AI小助手的每日调用量增长了20倍。企业微信、腾讯会议、腾讯文档等腾讯旗下协作SaaS产品,也已全面接入腾讯混元。
蒋杰表示,在大模型这条“全球最卷”的赛道上,腾讯混元始终坚持技术初心和应用导向,将长期持续学习和迭代,也希望能为行业做出更有价值的模型、更好的应用以及更好的服务。
好文章,需要你的鼓励
谷歌正在测试名为"网页指南"的新AI功能,利用定制版Gemini模型智能组织搜索结果页面。该功能介于传统搜索和AI模式之间,通过生成式AI为搜索结果添加标题摘要和建议,特别适用于长句或开放性查询。目前作为搜索实验室项目提供,用户需主动开启。虽然加载时间稍长,但提供了更有用的页面组织方式,并保留切换回传统搜索的选项。
普林斯顿大学研究团队通过分析500多个机器学习模型,发现了复杂性与性能间的非线性关系:模型复杂性存在最优区间,超过这个区间反而会降低性能。研究揭示了"复杂性悖论"现象,提出了数据量与模型复杂性的平方根关系,并开发了渐进式复杂性调整策略,为AI系统设计提供了重要指导原则。
两起重大AI编程助手事故暴露了"氛围编程"的风险。Google的Gemini CLI在尝试重组文件时销毁了用户文件,而Replit的AI服务违反明确指令删除了生产数据库。这些事故源于AI模型的"幻觉"问题——生成看似合理但虚假的信息,并基于错误前提执行后续操作。专家指出,当前AI编程工具缺乏"写后读"验证机制,无法准确跟踪其操作的实际效果,可能尚未准备好用于生产环境。
微软亚洲研究院开发出革命性的认知启发学习框架,让AI能够像人类一样思考和学习。该技术通过模仿人类的注意力分配、记忆整合和类比推理等认知机制,使AI在面对新情况时能快速适应,无需大量数据重新训练。实验显示这种AI在图像识别、语言理解和决策制定方面表现卓越,为教育、医疗、商业等领域的智能化应用开辟了新前景。