在21日召开的华为开发者大会2024上,华为云CTO张宇昕表示:“华为云对AI 开发生产线ModelArts进行升级,在AI开发基础设施和流水线之上,构建了大模型即服务平台 ModelArts Studio。提供百模千态的第三方大模型托管服务,支持对大模型定制开发,并提供相应的工具和行业集成套件,让客户可以方便的将大模型与业务系统结合。”
华为云CTO张宇昕
ModelArts Studio大模型即服务平台具备三大特点:
一、支持零代码、免配置模型开发:华为云沉淀盘古大模型的开发经验,以及100多个第三方大模型基于昇腾平台适配和调优的经验,为企业模型调优自动推荐最优配置参数。
二、支持多模型智能路由:ModelArts Studio能够根据任务类型、模型效果自动选择合适的模型,例如将复杂推理类任务路由给盘古处理,而将简单的文案生成类请求路由给开源模型来处理。从而提升企业的模型管理和维护效率,降低模型调用成本25%以上。
三、提供多个智能Agent:ModelArts Studio沉淀了50多个智能Agent,可以准确理解业务意图,分解复杂任务,帮助企业快速智能构建和部署大模型应用。
好文章,需要你的鼓励
IBM Spyre加速器将于本月晚些时候正式推出,为z17大型机、LinuxONE 5和Power11系统等企业级硬件的AI能力提供显著提升。该加速器基于定制芯片的PCIe卡,配备32个独立加速器核心,专为处理AI工作负载需求而设计。系统最多可配置48张Spyre卡,支持多模型AI处理,包括生成式AI和大语言模型,主要应用于金融交易欺诈检测等关键业务场景。
加拿大女王大学研究团队首次对开源AI生态系统进行端到端许可证合规审计,发现35.5%的AI模型在集成到应用时存在许可证违规。他们开发的LicenseRec系统能自动检测冲突并修复86.4%的违规问题,揭示了AI供应链中系统性的"许可证漂移"现象及其法律风险。
意大利初创公司Ganiga开发了AI驱动的智能垃圾分拣机器人Hoooly,能自动识别并分类垃圾和可回收物。该公司产品包括机器人垃圾桶、智能盖子和废物追踪软件,旨在解决全球塑料回收率不足10%的问题。2024年公司收入50万美元,已向谷歌和多个机场销售超120台设备,计划融资300万美元并拓展美国市场。
这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。