近日,OPPO安第斯大模型 (AndesGPT)登上SuperCLUE的9月排行榜,在十大基础能力排行榜的“知识与百科”能力中仅次于GPT4排名国内大模型第一,“角色扮演能力”中排名前三。
SuperCLUE是针对中文可用的通用大模型的一个测评基准,它着眼于综合评价大模型的能力,使其能全面的测试大模型的效果,又能考察模型在中文上特有任务的理解和积累。SuperCLUE从三个不同的维度评价模型的能力:基础能力、专业能力和中文特性能力,其中基础能力包括了常见的有代表性的模型能力,如语义理解、对话、知识与百科、逻辑推理、角色扮演、代码、生成与创作等10项能力。
安第斯大模型 (AndesGPT)作为OPPO自主训练的生成式大语言模型,在8月初就开始随着OPPO智能助理小布启动对外邀测,旨在对传统语音助手进行内核级升级,9月初行业发现OPPO也在申请“AndesGPT”相关的商标。
此次在SuperCLUE十大基础能力排行榜上,“知识与百科”能力AndesGPT测试得分高达98.33,大幅度领先其他大模型,仅次于GPT4排名国内第一,这与知识与百科问答是智能助手最刚需应用场景息息相关。早在2020年,OPPO就已启动相关技术的探索与实践,曾获得大规模知识图谱问答KgCLUE行业评测的第一名,此次曝光的AndesGPT也是主打知识与问答能力,通过引入高质量的知识图谱、QA问答数据,并结合对预训练和指令精调技术的优化,显著提升了大语言模型知识与百科能力的覆盖面和准确性。
好文章,需要你的鼓励
微软宣布裁减全球员工3%,主要影响中层管理岗位,旨在扁平化组织、提升效率,并利用新技术减轻重复工作负担。
亚马逊将与沙特支持的 AI 公司 Humain 合作,投资逾 50 亿美元在沙特建设 AI 区,提供专用 AWS 基础设施、服务器、网络以及培训认证,推动本地 AI 生态体系的发展。
创业家Joel Milne创立AutoUnify,通过API实时衔接经销商、维修店与厂商,为汽车行业解决多系统碎片化沟通问题,助推数字化转型。
文章介绍了Insurtech Bestow如何从直销人寿保险转型为向保险公司提供SaaS软件服务,并成功完成1.2亿美元D轮融资以拓展新产品与承保能力。