7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)在上海正式拉开帷幕。其中,超5.2万平方米的大会展区部分,重点围绕核心技术、智能终端、应用赋能三大板块,聚焦大模型、算力、机器人、自动驾驶等领域,集中展示了一批“人工智能+”创新应用成果。
国民智能科技品牌小度携旗下多款智能产品亮相WAIC展区,向大众呈现了在文心大模型的赋能下,完成全球首个AI原生操作系统DuerOS X“换脑”之后,给用户构建起来的全场景智能生活,吸引了众多参观者前来驻足体验。
其中,小度学习机Z30、小度添添闺蜜机(悦享版)、小度添添平板机器人、小度智能屏X9 Pro等产品,均在展台上亮相。“小度小度,我想听音乐”、“小度小度,我想听今天的新闻”、“小度小度,我想看科幻电影”……一句“小度小度”,用户就可以与小度开启对话聊天。而且在文心大模型、多模态感知、多轮智能交互、长短记忆存储理解等技术对加持下,这些小度产品都能够带来更聪明、更具拟人化的对话表现。
面向学习场景,小度在5月底重磅发布了学习机Z30,该产品在具备丰富的学习资源内容的同时,依托文心大模型的能力,针对计划、诊断、练习、学习、预习、育儿、答疑7大环节进行全面重构,打造了一位“学识渊博”、“关怀备至”、“循循善诱”的AI老师,实现了全场景、互动式、个性化的教学,从内容、兴趣、习惯上培养孩子,让学习有效率,更有效果,一举拉高学习机行业标准。
面向家庭娱乐场景,小度基于文心大模型推出了添添闺蜜机(悦享版),该产品是小度继定义“闺蜜机”这一新品类以来,推出的又一款具有赛道革新意义的产品。添添闺蜜机(悦享版)配备了23.8英寸触控屏,屏幕更小、移动更轻便灵活,据工作人员介绍,基于文心大模型定制的丰富AIGC应用功能,覆盖家庭全场景,为用户塑造出更加全能的“AI真闺蜜”,不仅拥有了更加丰富地内容和功能,更能为用户提供陪伴与情绪价值,使用体验突破想象边界。
面向家庭智能生活场景,小度“添添AI平板机器人”全面接入文心一言大模型,更加拥有“人格”和“生命力”。它可以像真人一样在和用户聊天时给予眼神动态追随和表情反馈,还能根据用户喜好和使用习惯,自动转换沟通角色、控制全屋家电等,还具备超级助理、贴心管家、百变搭档、看护帮手、娱乐助手等多重能力,能为用户提供更好的生活陪伴。
而且为满足不同用户更多元的需求,添添AI平板机器人能够灵活调用各种专业的智能体。据展台工作人员介绍,“现在小度不是一个人在为你服务,而是身后站着一群智能体的医生、老师、律师、国学大师、星座达人、健身教练等等。用户需要哪一位数字人,就可以请哪一位出来”。
面向家庭看护场景,小度在去年推出全新一代小度智能屏X9的基础之上,正式升级为小度智能屏X9 Pro,接入文心大模型的能力,不仅可以更好地理解用户的需求,支持多轮对话,提供更准确的回答和推荐内容之外,还具有AI魔画、AI口语、AI阅读、OCR智能识别能功能,陪娃学习、陪娃玩耍。此外,小度智能屏X9 Pro还能监听婴幼儿哭声,监测家长老人的活动状态等,给到家人最体贴入微的陪伴。
现如今,AI算力从云端逐渐转移到终端应用,大模型从软件应用逐渐渗透至硬件产品。已经连接超4600万家庭的“国民AI伙伴”小度,也成为了大模型的最佳载体,站在了AI技术变革的浪潮之巅。今年4月份,小度全面拥抱文心大模型实现DuerOS X能力进化,“换脑”的同时,也不断深入洞察用户需求,通过「AI+智能设备」创新,为用户打造更加有用、且有灵魂的智能新品。
未来,小度将结合AI大模型的时代机遇,加速构建全场景智能生活,用AI让人和设备的交互更自然,让生活更简单美好。
好文章,需要你的鼓励
这项研究介绍了VisCoder,一个经过专门微调的大语言模型,用于生成可执行的Python可视化代码。研究团队创建了包含20万样本的VisCode-200K数据集,结合了可执行代码示例和多轮修正对话。在PandasPlotBench基准测试中,VisCoder显著优于同等规模的开源模型,甚至在某些方面超越了GPT-4o-mini。研究还引入了自我调试评估模式,证明了反馈驱动学习对提高代码可执行性和视觉准确性的重要性。
这项研究提出了"适应再连续学习"(ACL)框架,一种创新的方法解决预训练模型在连续学习中的稳定性-可塑性困境。通过在学习新任务前先对模型进行适应性调整,ACL使模型既能更好地学习新知识(提高可塑性),又能保留已有知识(维持稳定性)。实验证明,该框架能显著提升各种连续学习方法的性能,为解决人工智能系统中的"灾难性遗忘"问题提供了有效途径。
这篇研究首次关注了CLIP模型文本编码器的对抗鲁棒性问题,提出了LEAF方法(Levenshtein高效对抗性微调)来增强文本编码器的稳健性。实验表明,LEAF显著提高了模型在面对文本扰动时的性能,在AG-News数据集上将对抗准确率从44.5%提升至63.3%。当集成到Stable Diffusion等文本到图像生成模型中时,LEAF显著提高了对抗噪声下的生成质量;在多模态检索任务中,它平均提高了10个百分点的召回率。此外,LEAF还增强了模型的可解释性,使文本嵌入的反演更加准确。
BenchHub是由韩国KAIST和Yonsei大学研究团队开发的统一评估平台,整合了38个基准中的30万个问题,按技能、学科和目标类型进行精细分类。研究显示现有评估基准存在领域分布偏差,而BenchHub通过自动分类系统和用户友好界面,让用户能根据特定需求筛选评估数据。实验证明模型在不同领域的排名差异巨大,强调了定制化评估的重要性。该平台支持多语言扩展和领域特化,为研究人员和开发者提供了灵活评估大语言模型的强大工具。