近日,OPPO安第斯大模型 (AndesGPT)登上SuperCLUE的9月排行榜,在十大基础能力排行榜的“知识与百科”能力中仅次于GPT4排名国内大模型第一,“角色扮演能力”中排名前三。
SuperCLUE是针对中文可用的通用大模型的一个测评基准,它着眼于综合评价大模型的能力,使其能全面的测试大模型的效果,又能考察模型在中文上特有任务的理解和积累。SuperCLUE从三个不同的维度评价模型的能力:基础能力、专业能力和中文特性能力,其中基础能力包括了常见的有代表性的模型能力,如语义理解、对话、知识与百科、逻辑推理、角色扮演、代码、生成与创作等10项能力。
安第斯大模型 (AndesGPT)作为OPPO自主训练的生成式大语言模型,在8月初就开始随着OPPO智能助理小布启动对外邀测,旨在对传统语音助手进行内核级升级,9月初行业发现OPPO也在申请“AndesGPT”相关的商标。
此次在SuperCLUE十大基础能力排行榜上,“知识与百科”能力AndesGPT测试得分高达98.33,大幅度领先其他大模型,仅次于GPT4排名国内第一,这与知识与百科问答是智能助手最刚需应用场景息息相关。早在2020年,OPPO就已启动相关技术的探索与实践,曾获得大规模知识图谱问答KgCLUE行业评测的第一名,此次曝光的AndesGPT也是主打知识与问答能力,通过引入高质量的知识图谱、QA问答数据,并结合对预训练和指令精调技术的优化,显著提升了大语言模型知识与百科能力的覆盖面和准确性。
好文章,需要你的鼓励
法国人工智能公司Mistral AI宣布完成17亿欧元(约20亿美元)C轮融资,由荷兰半导体设备制造商ASML领投。此轮融资使Mistral估值从去年的60亿美元翻倍至137亿美元。英伟达、DST Global等知名投资机构参投。作为欧洲领先的AI开发商,Mistral凭借先进的多语言大模型与OpenAI等美国公司竞争,其聊天机器人Le Chat具备语音模式等功能。
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
VAST Data收购了成立仅数月的初创公司Red Stapler,该公司由NetApp资深团队创立。Red Stapler创始人兼CEO Jonsi Stefansson将担任VAST云解决方案总经理,负责超大规模云战略。Red Stapler拥有6名开发人员,开发了跨SaaS交付、API集成、监控等功能的云控制平面和服务交付平台,将加速VAST AI OS在超大规模和多云环境中的部署,深化与全球领先超大规模云服务商的合作关系。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。