模型卡支持开源模型,可提高透明度、暴露潜在偏差和模型漂移
数据和人工智能(AI)领域的领先者SAS即将推出模型卡和全新AI治理咨询服务,用以改善AI治理、提高模型可信度和透明度。这些值得信赖的全新AI产品和服务将帮助企业把握变幻莫测的AI市场需求、降低风险,从而更自信地追求AI目标。SAS还发布了可信任的AI生命周期工作流,并与美国国家标准与技术研究院(NIST) 的AI风险管理框架建立了映射关系。
“我们的客户非常看好AI的应用潜力,但对于何时开展AI部署以及如何使用AI仍持谨慎态度。”SAS数据道德实践副总裁Reggie Townsend表示:“这些问题提的很好,因为它们事关AI可信度和AI伦理。我们的目标是基于数十年的经验,为其提供在现有系统中集成AI的工具并加以指导,帮助他们减少无意的影响和危害,同时提高盈利能力。”
模型卡:值得信赖的AI“营养标签”
AI生命周期各个阶段涉及人员众多,我们很难将复杂的AI模型转化为中每个人都能轻松理解的东西。随着世界各地出台新的法规和条例,对企业来说,有能力理解并向监管机构说明模型的运行原理将变得至关重要。SAS® Viya®即将推出的模型卡功能将服务于AI生命周期各阶段的利益相关者。从开发人员到董事会成员,所有利益相关者都将在这一支持专有和开源模型的、精心设计的工具中收获价值。
模型卡将于2024年中正式发布,AI模型“营养标签”是对其最贴切的比喻。SAS将基于SAS产品内容为注册模型自动生成模型卡,而无需用户创建。此外,由于SAS Viya有现成的开源管理架构,模型卡也将适用于开源模型(首批支持Python模型)。
模型卡将突出显示准确率、公平性和模型漂移(即模型性能随条件变化而衰减的程度)等指标。模型卡也记录了一些治理细节,比如上次模型修改时间、模型贡献者和负责人等等,便于企业在内部处理模型性能异常问题。模型用途部分则显示了设计用途、超出范畴的用例和使用限制等——在透明度和模型审计有望成为规范的业务操作的同时,这些也将成为关键要素。 今年早些时候,SAS Insight分析师大会曾经展示过模型卡。
“SAS正采取缜密的措施来帮助客户拥抱AI,专注于应对真实行业场景中AI部署的现实和挑战。”IDC分析公司研究总监Eric Gao表示:“模型卡将有助于监控AI项目和增强透明度。”
AI伦理资深人士领衔新的AI治理小组
随着AI的普及,SAS客户越来越关注如何高效安全地使用其数据。为了帮助他们顺利踏上数据和AI之旅,SAS推出了AI治理咨询——一项面向现有客户的增值服务。
从一个简短的会议开始,SAS AI治理咨询服务将帮助客户思考AI治理能为其组织带来什么改变。试用过该服务的客户强调指出,他们得到了以下几点收获:
●得益于可信任的分布式决策,提高了生产力。
●得益于更好的数据问责机制,提高了数据可信度。
●有能力开展可信任的创新实践,并因此赢得并留住了顶尖人才。
●通过实施“前瞻性合规”,提升了竞争优势和市场敏捷性。
●克服了对社会和环境的潜在影响,从而提高了品牌价值。
波兰PZU保险公司是中欧和东欧地区最大的金融机构之一。作为SAS的长期客户,PZU在索赔、销售、欺诈侦测和客户关怀等领域都部署了AI。
“通过与SAS进行AI治理对话,我们能够看见并考虑那些可能被忽视的因素,避免它们给客户和我们的业务带来潜在的问题。”PZU信息、数据与分析管理董事总经理(首席数据官/首席分析官)Marek Wilczewski表示:“在着手AI项目时,我们可以更好地理解拥有更多视角的重要性。”
行业资深人士和AI伦理专家Steven Tiell已被聘为SAS全球AI治理总监。Tiell曾在埃森哲领导全球数据伦理和可信任的创新实践,也曾担任DataStax的AI战略副总裁。
基于新的政府标准打造可信赖的AI生命周期工作流
去年,美国国家标准与技术研究院(NIST)推出了一个AI风险管理框架。在官方条例缺席的情况下,这一管理框架已成为企业的一项宝藏工具,可用于设计并管理可信任的AI系统。
SAS创建了可信任的AI生命周期工作流,通过明确个体角色和预期目标、收集所需文档、列出要考虑的因素以及利用自动化降低采用难度,使机构组织更易于采纳NIST的风险管理建议。企业最终会得到附有文档的生产模型,在文档中显示了他们做的尽职调查,以确保模型的公平性以及生产过程不会造成危害。
关于AI系统对人类生活的影响,该工作流支持企业记录下他们需要考虑的因素。其中包含了一些步骤,可确保训练数据能够代表受影响人群,同时确保模型预测和性能也能够代表各个受保护阶层。这些步骤有助于确保模型不会对不同特定群体造成迥然不同的影响或危害。此外,在需要考虑额外因素时,用户还可以创建人机回圈任务,以确保模型随时间推移依然保持原有的准确度。
SAS可信任的AI生命周期工作流即将登陆NIST人工智能资源中心,目前在SAS模型管理器资源平台Github提供下载服务。
今日资讯是SAS Innovate大会上发布的。SAS Innovate大会是分析领导者SAS面向商业领袖、技术用户和SAS合作伙伴举办的数据和人工智能领域的盛会。了解SAS的最新消息,请关注SAS的Twitter账户@SASsoftwareNews。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。