英特尔一亮相MWC,就立即打出了一套软硬件组合拳,旨在满足5G和边缘部署对可持续发展和AI的需求。
硬件领域更新
我们从硬件看起,这里有两个值得关注的重要消息。首先,英特尔发布了用于5G核心网的至强处理器 Sierra Forest,该处理器将于2024年面世,与上一代芯片相比,单机架性能提高2.7倍。
抛开营销上的噱头不谈,英特尔公司副总裁兼有线与核心网部门总经理Alex Quach告诉记者,“这实际上是为了减少机架的数量,降低将数据中心带到边缘所需的能耗。”
但这是怎么做到的?根据Alex Quach的说法,Sierra Forrest充分利用了英特尔基础设施电源管理器(Intel Infrastructure Power Manager)软件,该软件可使芯片在任意特定时间内,根据流量需求,动态地改变电源状态(即活跃状态与空闲状态)。这改变了以往做法,即将芯片设置为始终以最大功率运行。
Alex Quach说,到目前为止,性能一直是服务提供商的首要标准。但随着电力成本和限制的增加,以及越来越多的服务器向边缘迁移,运营商越来越重视降低能耗。
这就是电源管理器可以一展所长的地方。自2021年发布Ice Lake以来,英特尔芯片就具备了电源管理器功能。Alex Quach说,从那时起,英特尔就一直在努力通过减少改变状态所需的时间,来不断提高功耗性能。他说,Sierra Forrest这样的芯片现在可以在纳秒级的时间内,从2.1 GHz的功率降至800 MHz,而无需更多步骤。如果与主要电信供应商的商业应用软件搭配使用,电源管理器可以在运行时为核心网节省高达30%的能耗。再加上更多的处理器内核(Sierra Forrest有288个内核),这就是Sierra Forrest性能和功耗改进的原因。
第二个硬件相关的新闻是关于英特尔下一代处理器Granite Rapids-D,该处理器内置AI功能和英特尔虚拟无线接入网络(vRAN)加速功能,将于2025年面世。英特尔表示,目前这款芯片已经在提供样品,其中三星和爱立信已经采用了该芯片。
在边缘进行推理
在软件方面,英特尔发布了全新边缘平台(EdgePlatform)。更准确地说,它是一个位于服务器上的模块化软件抽象层,可通过仪表板实现基础架构管理、工作负载优化和AI开发功能。具体来说,基于英特尔OpenVINO工具套件的AI功能,主要面向推理用例,而非模型训练。
如果这一切听起来似曾相识,那是因为英特尔在2023年9月发布了该平台,当时它被称为Project Strata。
英特尔公司副总裁兼网络与边缘事业部软件工程总经理Pallavi Mahajan在新闻发布会上指出,在云中部署AI与在边缘部署AI有很大不同。这是因为边缘的硬件、软件和操作系统种类繁多,功率和空间有限。她补充说,该平台旨在应对所有这些挑战,让服务提供商和企业都能更轻松地部署边缘AI。
Futurum Group研究总监Ron Westfall表示,该平台直接解决了"采用和扩展AI的主要痛点"。这与全行业的趋势是一致的,即:企业管理的数据越来越多地在数据中心或云之外进行处理。Ron Westfall说:“对于保持生成数据私密性以及保护所有有价值知识产权的需求,在本地处理数据可以确保企业遵守相关法律法规。“
如果你相信J.Gold Associates公司负责人、分析师JackGold的言论,那么该平台可能会产生巨大影响,因为"现在可能有85%以上的核心网和RAN系统已经基于英特尔硬件运行,而这个平台是一款极具吸引力,且与现有系统兼容的边缘系统部署方案。"此外,Jack Gold认为,80%至90%的AI工作负载最终将是推理而非训练。
基本上,数据中心目前主要承担AI训练任务,但AI将越来越多地转移到边缘。Jack Gold总结道:“因此,边缘系统必须经过优化,这样才能处理推理工作负载。
好文章,需要你的鼓励
NVIDIA团队开发的SANA-Sprint技术实现了AI图像生成的重大突破,将传统需要20步的生成过程压缩至1步,在H100上仅需0.1秒即可生成1024×1024高清图像,速度比现有最快模型提升10倍以上。该技术通过创新的混合蒸馏策略,在大幅提升速度的同时保持了图像质量,并支持实时交互应用,为AI绘画从专业工具向大众应用的转变奠定了基础。
初创公司Positron获得5160万美元A轮融资,推出专门针对AI推理的Atlas芯片。该公司声称其芯片在性能功耗比和成本效益方面比英伟达H100高出2-5倍,并已获得Cloudflare等企业客户采用。Positron专注于内存优化设计,无需液体冷却,可直接部署在现有数据中心。公司计划2026年推出支持16万亿参数模型的下一代Titan平台。
北京人工智能研究院团队开发的DiagNote模型通过模仿人类做笔记的习惯,解决了AI在多轮视觉对话中容易"失忆"的问题。该研究构建了专门的MMDiag数据集,设计了双模块协作的AI架构,让机器学会像人类一样通过标记重点区域来保持专注力,为更自然的人机视觉交流奠定了基础。