[中国,上海,2024年7月5日]昇腾人工智能产业高峰论坛2024在上海举办,会上华为正式发布昇腾大模型推理解决方案,并联合11家生态伙伴及客户发布基于昇腾大模型推理解决方案的五大场景优秀实践。
昇腾大模型推理解决方案正式发布暨五大场景优秀实践
为更好地匹配大模型的推理需求,华为基于昇腾AI基础软硬件,向业界提供使能推理应用快速开发、高效部署的大模型推理解决方案。该解决方案可通过启发式并行解码等系列化推理加速技术,实现应用吞吐最高6倍提升,满足业务SLO的同时,释放极致吞吐性能,让单位吞吐的成本更优。同时,既提供昇腾原生服务化能力,也支持对vLLM、TGI等三方服务框架的快速适配,实现应用天级上线,在满足模型表现的同时,通过极简服务适配,让业务上线时间更短。除此之外,为多机推理提供了完整的弹性推理软件栈,在满足TCO要求的同时,支持灵活弹性扩容,让推理系统面向大模型未来趋势具备更强的演进能力。以此,帮助伙伴和客户打造更贴合场景需求的推理系统。
华为携手业界伙伴和客户不断创新,加速大模型应用落地到场景。会上,华为联合京东、科大讯飞、中国移动、中电信、WPS AI、中国联通、哔哩哔哩、商汤科技、生数科技、华为小艺、华为流程IT等11家生态伙伴及客户发布了基于昇腾大模型推理解决方案的五大场景优秀实践,共同见证人工智能大模型在“文本生成、文生视图、辅助编程、终端应用、智能办公/客服”等五大场景应用启航的历史时刻。
大模型只有与应用场景相结合才能发挥最大的价值,五大场景优秀实践的发布是昇腾大模型解决方案与业界伙伴、客户的模型应用在大模型落地行业场景道路上走出的坚实一步,将为这些场景在提升工作效率、改善服务质量、推动创新发展方面提供助力,也为更多场景下的大模型应用提供了有益参考。
未来,华为将继续携手伙伴基于昇腾AI进行大模型落地实践的联合创新,加速AI走深向实,助力经济和社会发展。
好文章,需要你的鼓励
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
数据分析平台公司Databricks完成10亿美元K轮融资,公司估值超过1000亿美元,累计融资总额超过200亿美元。公司第二季度收入运营率达到40亿美元,同比增长50%,AI产品收入运营率超过10亿美元。超过650家客户年消费超过100万美元,净收入留存率超过140%。资金将用于扩展Agent Bricks和Lakebase业务及全球扩张。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。