“据统计,GPU的平均利用率不超过30%,会产生巨大的算力资源浪费。我们用软件定义的方式通常可以把用户GPU的利用率提升3-8倍,甚至可以到10倍。”
这是算力池化软件公司趋动科技援引行业报告数据并结合自身企业最佳实践经验给出的最新数据。通过自研的猎户座OrionX AI算力资源池化软件,趋动科技可以帮助客户构建数据中心级 AI 算力资源池,客户无需修改应用就能使用数据中心内任一台服务器的 AI 算力,并通过大幅优化应用部署,提升用户的资源利用率,为AI产业带来全新的算力供给模式。
重新定义AI算力资源
在第二届光合组织AI解决方案大赛上,趋动科技基于与海光硬件产品底座的适配和优化,打造的“信创全栈自主可控异构AI算力资源池”(以下简称“AI算力资源池”)方案,获得了本届大赛一等奖。
趋动科技生态运营总监文禹翔介绍,AI算力资源池方案主要针对当前异构算力使用方式粗放、跨厂商异构算力资源难以统一管理调度等问题。方案将物理异构算力资源进行池化管理,实现按需调度异构算力资源及跨厂商异构算力资源精细化管理。
方案架构图
方案中的基础设施层,依托于海光服务器的性能优势,可以实现两大跃升;在操作系统层,AI算力资源池基于银河麒麟服务器操作系统,借助海光CPU、DCU平台优势,对内核安全、RAS特性、I/O性能、虚拟化和国产硬件、驱动支持等方面进一步优化增强;在虚拟化层,趋动科技OrionX将AI算力资源抽象为虚拟资源,最终实现AI算力资源的软件定义。
“目前,应用部署中资源直连独占,造成算力资源浪费和使用不灵活等问题,让算力用户的成本负担持续加重,已经在一定程度上阻碍了AI技术的进一步大发展。我们希望过去看起来‘阳春白雪’的算力,能够真正成为一种普惠大众的资源,就像水电一样按需随用随取、灵活便捷且便宜高效”文禹翔表示。
让生态飞轮加速旋转
最近由人民银行主管的期刊《金融电子化》中,刊登了一篇华夏银行CIO署名文章题为《人工智能GPU算力资源池化应用研究》的文章。该文章详细论述了异构算力资源池化软件在信创领域的应用价值,进一步验证了趋动科技OrionX异构算力池化软件方案的可行性,同时也对海光加速卡等国产硬件性能给予了肯定。
“信创领域的算力资源池建设需要链接国产软硬件厂商共同推动,海光在国产芯片行业处于领先梯队,为我们提供了很大的支撑。”文禹翔表示,通过与海光合作,趋动科技实现了池化软件异构算力多元化,进一步满足了信创市场的应用需求。
事实上,自加入光合组织以来,趋动科技与海光等产业链上下游伙伴开展了一系列生态合作。在趋动科技看来,用户需要的是完整的解决方案,而单一厂商很难提供从底层架构到前端应用的一整套产品,在此背景下,生态力量的整合非常关键。
“光合组织为AI产业的生态对接提供了一个很好的平台。”文禹翔指出,基于光合组织大赛,趋动科技不仅与伙伴深化了产品技术合作、展示了方案成果,同时也广泛联动更多产业力量,逐渐形成生态的“飞轮”,在市场赋能、项目引进等领域逐渐跑出了加速度。
“我相信,随着飞轮的转速不断加快,未来,算力池化方案将触达更多业务应用场景,AI算力会释放出更大的价值。”文禹翔表示。
好文章,需要你的鼓励
IDC数据显示,Arm架构服务器出货量预计2025年将增长70%,但仅占全球总出货量的21.1%,远低于Arm公司年底达到50%市场份额的目标。大规模机架配置系统如英伟达DGX GB200 NVL72等AI处理设备推动了Arm服务器需求。2025年第一季度全球服务器市场达到创纪录的952亿美元,同比增长134.1%。IDC将全年预测上调至3660亿美元,增长44.6%。配备GPU的AI服务器预计增长46.7%,占市场价值近半。
保加利亚研究团队通过创新的双语训练方法,成功让AI模型学会了在非英语环境下使用外部工具。他们开发的TUCAN模型在保加利亚语功能调用任务上实现了显著提升,小模型改进幅度达28.75%。更重要的是,团队开源了完整的方法论,为全球多语言AI工具使用能力的发展提供了可复制的解决方案。
AI正在重塑创业公司的构建方式,这是自云计算出现以来最重大的变革。January Ventures联合创始人Jennifer Neundorfer将在TechCrunch All Stage活动中分享AI时代的新规则,涵盖从创意验证、产品开发到团队架构和市场策略的各个方面。作为专注于B2B早期投资的风投合伙人,她将为各阶段创业者提供关键洞察。
清华大学团队开发了首个能同时理解街景、卫星图、轨迹和地理数据的城市AI系统UrbanLLaVA。通过创新的三阶段训练法和多模态融合技术,该系统在十二项城市任务测试中显著超越现有方法,为智慧城市、导航服务、城市规划等领域带来突破性进展,代码已开源。