7月26日至29日,第二十一届中国国际数码互动娱乐展会(ChinaJoy)在上海举办。
火山引擎南区游戏行业解决方案负责人杨旭东应邀参会并发表题为《创新驱动,畅享无限:字节豆包大模型为游戏世界注入全新可能》的主题演讲,深入介绍火山引擎基于 AI 大模型等技术推出的游戏 AI 解决方案。
杨旭东表示:“全新升级的火山引擎游戏 AI 解决方案,一是对本身能力特别是 AI 方面做了升级,二是在场景部分结合豆包大模型语音、语言、图形等能力进行了升级。”方案基于字节跳动自身业务中丰富的 AI 应用场景打磨出卓越的 AI 基础能力,通过 AI 开放平台向企业提供即开即用的 AI 原子化能力,并以 AI 开发平台助力用户进行各种 AI 模型的一站式开发。此外,火山方舟平台还支持企业直接调用大模型推理和自助进行模型精调。
Al大模型革新游戏世界,玩法创新正当时
AI 大模型浪潮涌动,游戏行业迎来变革。今年是 AIGC 整体落地元年,从内容生成到玩家体验优化,越来越多的游戏企业都试图通过 AI 大模型,探索更多新互动模式和新玩法。杨旭东认为,当前游戏行业在玩法创新上主要聚焦于三个核心场景,均由 AI 大模型推动。
闯关类:大模型的智能算法为休闲游戏注入了策略性和智慧,玩家在与 AI 的互动对抗中体验到更深层次的挑战与乐趣。
情感陪伴类:AI 大模型在情感陪聊游戏中提供了高度个性化和情感化的交流体验,使玩家能够与游戏角色建立更加真实和细腻的情感联系。
NPC 智能体类:在 NPC 智能体的游戏场景中,大模型的应用让 NPC 展现出前所未有的生动性和深度。它们超越了传统 NPC 的界限,通过先进的决策机制,显著增强了游戏的互动性和可玩性。
这三类玩法不仅丰富了玩家的游戏体验,也展示出 AI 大模型在游戏设计和开发中的关键作用,为游戏行业带来了前所未有的创新动力和发展潜力。但是,想要开发这类游戏,需要极其深入、复杂的技术能力做支撑。目前,火山引擎正基于游戏 AI 解决方案,与多家游戏企业共同基于 AI 大模型技术,深入游戏场景,创新游戏玩法,驱动业务增长。
凝练三大优势,以大模型为动能推进业务增长
AI 大模型正在加速游戏行业变革。企业试图通过大模型寻找转型机遇,过程中也常常会面临模型选型难、成本难控制、能否满足大规模用户需求、安全信任难保障等问题。
依托豆包大模型更强模型、更低价格、更易落地的特性,以及字节跳动旗下多样化产品和平台的支持,火山引擎游戏 AI 解决方案凝练出三大优势,助力游戏企业做好 AI 转型。
大规模业务支撑:豆包大模型具备完善的系统承载力,以及海量资源、瞬时可用、极致弹性等特性。豆包大模型能力已经过 AI 智能助手豆包App 实践验证,月活用户超2600万,能够在搜索回答、文本理解、文案创作、图片生成等多种场景中,保障游戏业务稳定和成本可控。
独特插件:方案具备独有的插件(内容加持)能力,可用于适配游戏 AI NPC 的各类玩法。其中,通用模型、角色扮演模型、语音合成模型等,覆盖了从文本到语音的多种游戏场景需求。此外,内容插件、RAG 知识库插件、联网插件等多类核心插件,进一步提升了大模型的搜索和交互能力,为用户提供海量内容资源。
丰富生态:火山引擎能为用户提供构建一个完整的游戏 AI 玩法所需要各类生态周边能力,包括扣子 AI 应用开发平台、语音类模型、文生图模型、即梦 AI 等。其中,扣子专业版支持用户0代码搭建个性化 AI 原生应用;语音类模型声音自然识别率高且5秒钟即可完成声音复刻;即梦 AI 支持自然语言及图片输入,能够生成高质量的图像及视频。
Al 大模型正在成为游戏企业冲击玩法创新的“利器”。未来火山引擎将继续深耕游戏行业,基于 AI 大模型,打造集游戏开发、测试、部署和推广于一体的一站式服务,驱动业务增长。正如杨旭东所言,“我们相信 AIGC 的力量,也相信豆包大模型、火山引擎 AI 游戏解决方案能为游戏未来注入新的动力。”
好文章,需要你的鼓励
继苹果和其他厂商之后,Google正在加大力度推广其在智能手机上的人工智能功能。该公司试图通过展示AI在移动设备上的实用性和创新性来吸引消费者关注,希望说服用户相信手机AI功能的价值。Google面临的挑战是如何让消费者真正体验到AI带来的便利,并将这些技术优势转化为市场竞争力。
麻省理工学院研究团队发现大语言模型"幻觉"现象的新根源:注意力机制存在固有缺陷。研究通过理论分析和实验证明,即使在理想条件下,注意力机制在处理多步推理任务时也会出现系统性错误。这一发现挑战了仅通过扩大模型规模就能解决所有问题的观点,为未来AI架构发展指明新方向,提醒用户在复杂推理任务中谨慎使用AI工具。
Meta为Facebook和Instagram推出全新AI翻译工具,可实时将用户生成内容转换为其他语言。该功能在2024年Meta Connect大会上宣布,旨在打破语言壁垒,让视频和短视频内容触达更广泛的国际受众。目前支持英语和西班牙语互译,后续将增加更多语言。创作者还可使用AI唇形同步功能,创造无缝的口型匹配效果,并可通过创作者控制面板随时关闭该功能。
中科院自动化所等机构联合发布MM-RLHF研究,构建了史上最大的多模态AI对齐数据集,包含12万个精细人工标注样本。研究提出批评式奖励模型和动态奖励缩放算法,显著提升多模态AI的安全性和对话能力,为构建真正符合人类价值观的AI系统提供了突破性解决方案。