4月23日,联想举办ThinkPad AI春季新品探秘之旅暨ThinkPad思考·AI空间揭幕活动,ThinkPad首席产品官张豪宣布,备受期待的AI高性能专业工程师本——ThinkPad T14p AI 2024当日正式开售。
ThinkPad首席产品官张豪
活动现场,张豪详细介绍了全新ThinkPad T14p AI 2024在“高效办公”与“专业创作”方面为用户带来的全新AI体验。
在高效办公方面,ThinkPad T14p AI 2024通过知识问答和内容总结生成能力,可以帮助用户快速整理文档内容并完成关键信息提炼。AI PPT功能能迅速根据内容大纲生成美观且格式丰富的演示文稿。此外,AI智会功能不仅可以快速梳理会议内容,还能在用户需要临时离开视频会议时代替其参与,保持会议的连续性。在用户返回后,它还能自动生成该期间的会议纪要,确保用户不会因为离开而遗漏信息。
ThinkPad T14p AI 2024
在专业创作方面, ThinkPad通过与AI生态伙伴合作,完成了AI专业文字创作、AI专业图形创作、AI专业影音创作、AI专业编辑和编程等不同领域的跨越及专精。例如,在AI专业文字创作方面,ThinkPad与中科创达的法律模型相结合,让零基础用户能够像撰写短文一样轻松生成合同等专业法律文件。在AI专业影音创作领域,ThinkPad通过与行者AI的音乐创作模型接轨,简化了复杂的音乐创作过程,用户只需提出简单的需求,就能生成丰富多彩的乐章。在AI专业编辑和编程方面,ThinkPad与北大Codeshell的编程模型相融合,提供全流程的智能编程支持,包括代码生成、补全、纠错、重构、注释、文档编写和代码评测等功能。在AI专业图形创作上,ThinkPad T14p AI 2024的AI画师可以赋予内容创作者全新想象力,简单的文本描述或草图顷刻间就能转化为令人惊艳的视觉图像,实现AI和艺术的完美结合。
同时,ThinkPad T14p AI 2024实现极致性能、极致视界、极致可靠的“三大极致”,再度引领行业创新潮流,被誉为业界最强14.5寸高扩展AI战力本。ThinkPad T14p AI 2024拥有3K级别的高色域、高色准、高刷高亮屏幕,把双内存、双硬盘与40系列RTX独立显卡,装进了一个17.7mm的14.5英寸机身中,再一次引领行业结构创新,不仅如此,ThinkPad T14p AI 2024配备了高达200万亿次每秒的AI算力,能够最大限度提升用户的工作效率和创作灵感。
据介绍,ThinkPad AI PC内嵌个人智能体——联想小天,由本地的大模型驱动,通过自然交互,可以在工作、学习和生活等诸多场景为用户带来全新的AI体验。
活动当天,联想正式启动AI PC的公测计划与粉丝大使招募计划,诚邀520名热爱科技、愿意尝鲜的粉丝用户,一起体验ThinkPad个人智能体——联想小天。此外,ThinkPad还推出 AI千人先锋“终身”焕新计划,凡在首发期内购买ThinkPad X1 Carbon AI、ThinkPad P16v AI、ThinkPad T14p AI产品,并登记完整信息的前1000名粉丝,将不限时、不限期,享受一次一元换新的权益。
联想AI PC旗舰新品ThinkPad T14p AI 2024,不仅是联想创新力的集中体现,更让AI技术变得触手可及。
好文章,需要你的鼓励
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。
这项研究提出了"思想家"(Thinker)任务,一种受人类双重加工理论启发的新型AI训练方法。研究者将问答过程分解为四个阶段:快速思考(严格预算下给出初步答案)、验证(评估初步答案)、慢速思考(深入分析修正错误)和总结(提炼关键步骤)。实验表明,该方法使Qwen2.5-1.5B模型的准确率从24.9%提升至27.9%,DeepSeek-R1-Qwen-1.5B模型从45.9%提升至49.8%。显著的是,仅使用快速思考模式就能达到26.8%的准确率,且消耗更少计算资源,证明了直觉与深度推理作为互补系统的培养价值。
这项由ELLIS研究所和马克斯·普朗克智能系统研究所的科学家进行的研究,揭示了大语言模型安全测试的根本规律:越狱攻击成功率由攻击者与目标模型间的能力差距决定。通过评估500多个攻击者-目标组合,研究团队发现:更强的模型是更好的攻击者;当目标能力超过攻击者时攻击成功率急剧下降;社会科学能力比STEM知识更能预测攻击成功。基于这些发现,研究者建立了预测模型,表明随着AI进步,人类红队测试可能逐渐失效,提示需要发展自动化安全评估方法及更全面地评估模型的说服和操纵能力。