近日,OPPO安第斯大模型 (AndesGPT)登上SuperCLUE的9月排行榜,在十大基础能力排行榜的“知识与百科”能力中仅次于GPT4排名国内大模型第一,“角色扮演能力”中排名前三。
SuperCLUE是针对中文可用的通用大模型的一个测评基准,它着眼于综合评价大模型的能力,使其能全面的测试大模型的效果,又能考察模型在中文上特有任务的理解和积累。SuperCLUE从三个不同的维度评价模型的能力:基础能力、专业能力和中文特性能力,其中基础能力包括了常见的有代表性的模型能力,如语义理解、对话、知识与百科、逻辑推理、角色扮演、代码、生成与创作等10项能力。
安第斯大模型 (AndesGPT)作为OPPO自主训练的生成式大语言模型,在8月初就开始随着OPPO智能助理小布启动对外邀测,旨在对传统语音助手进行内核级升级,9月初行业发现OPPO也在申请“AndesGPT”相关的商标。
此次在SuperCLUE十大基础能力排行榜上,“知识与百科”能力AndesGPT测试得分高达98.33,大幅度领先其他大模型,仅次于GPT4排名国内第一,这与知识与百科问答是智能助手最刚需应用场景息息相关。早在2020年,OPPO就已启动相关技术的探索与实践,曾获得大规模知识图谱问答KgCLUE行业评测的第一名,此次曝光的AndesGPT也是主打知识与问答能力,通过引入高质量的知识图谱、QA问答数据,并结合对预训练和指令精调技术的优化,显著提升了大语言模型知识与百科能力的覆盖面和准确性。
好文章,需要你的鼓励
亚马逊在生成式AI爆发初期便敏锐意识到了人工智能培训的重要性,2023年宣布启动“AI就绪(AI Ready)”计划,通过系统化的人才培养架构,不仅着眼解决当下企业AI应用的人才缺口,更为全球数字经济发展构建了AI人才储备体系。
Mitre 的 CVE 项目确认 Armis 为新 CNA,同时 Armis 推出免费漏洞情报数据库,助力企业更快应对网络安全威胁。
Google宣布取消 Chrome 中针对第三方 Cookie 的独立提示,此举因隐私技术进步与全球监管变化驱动,公司将继续提供用户手动选择退出功能,同时调整隐私沙箱技术路线图。
OpenAI 宣布将于今年晚些时候发布自 GPT-2 后首个开源语言模型,由研究副总裁 Aidan Clark 领导,预计初夏推出。该模型针对高端消费硬件,可灵活启用推理功能,并采用宽松许可证和严格安全评估,此举旨在应对 DeepSeek、Meta 等开源对手的竞争。