英特尔一亮相MWC,就立即打出了一套软硬件组合拳,旨在满足5G和边缘部署对可持续发展和AI的需求。
硬件领域更新
我们从硬件看起,这里有两个值得关注的重要消息。首先,英特尔发布了用于5G核心网的至强处理器 Sierra Forest,该处理器将于2024年面世,与上一代芯片相比,单机架性能提高2.7倍。
抛开营销上的噱头不谈,英特尔公司副总裁兼有线与核心网部门总经理Alex Quach告诉记者,“这实际上是为了减少机架的数量,降低将数据中心带到边缘所需的能耗。”
但这是怎么做到的?根据Alex Quach的说法,Sierra Forrest充分利用了英特尔基础设施电源管理器(Intel Infrastructure Power Manager)软件,该软件可使芯片在任意特定时间内,根据流量需求,动态地改变电源状态(即活跃状态与空闲状态)。这改变了以往做法,即将芯片设置为始终以最大功率运行。
Alex Quach说,到目前为止,性能一直是服务提供商的首要标准。但随着电力成本和限制的增加,以及越来越多的服务器向边缘迁移,运营商越来越重视降低能耗。
这就是电源管理器可以一展所长的地方。自2021年发布Ice Lake以来,英特尔芯片就具备了电源管理器功能。Alex Quach说,从那时起,英特尔就一直在努力通过减少改变状态所需的时间,来不断提高功耗性能。他说,Sierra Forrest这样的芯片现在可以在纳秒级的时间内,从2.1 GHz的功率降至800 MHz,而无需更多步骤。如果与主要电信供应商的商业应用软件搭配使用,电源管理器可以在运行时为核心网节省高达30%的能耗。再加上更多的处理器内核(Sierra Forrest有288个内核),这就是Sierra Forrest性能和功耗改进的原因。
第二个硬件相关的新闻是关于英特尔下一代处理器Granite Rapids-D,该处理器内置AI功能和英特尔虚拟无线接入网络(vRAN)加速功能,将于2025年面世。英特尔表示,目前这款芯片已经在提供样品,其中三星和爱立信已经采用了该芯片。
在边缘进行推理
在软件方面,英特尔发布了全新边缘平台(EdgePlatform)。更准确地说,它是一个位于服务器上的模块化软件抽象层,可通过仪表板实现基础架构管理、工作负载优化和AI开发功能。具体来说,基于英特尔OpenVINO工具套件的AI功能,主要面向推理用例,而非模型训练。
如果这一切听起来似曾相识,那是因为英特尔在2023年9月发布了该平台,当时它被称为Project Strata。
英特尔公司副总裁兼网络与边缘事业部软件工程总经理Pallavi Mahajan在新闻发布会上指出,在云中部署AI与在边缘部署AI有很大不同。这是因为边缘的硬件、软件和操作系统种类繁多,功率和空间有限。她补充说,该平台旨在应对所有这些挑战,让服务提供商和企业都能更轻松地部署边缘AI。
Futurum Group研究总监Ron Westfall表示,该平台直接解决了"采用和扩展AI的主要痛点"。这与全行业的趋势是一致的,即:企业管理的数据越来越多地在数据中心或云之外进行处理。Ron Westfall说:“对于保持生成数据私密性以及保护所有有价值知识产权的需求,在本地处理数据可以确保企业遵守相关法律法规。“
如果你相信J.Gold Associates公司负责人、分析师JackGold的言论,那么该平台可能会产生巨大影响,因为"现在可能有85%以上的核心网和RAN系统已经基于英特尔硬件运行,而这个平台是一款极具吸引力,且与现有系统兼容的边缘系统部署方案。"此外,Jack Gold认为,80%至90%的AI工作负载最终将是推理而非训练。
基本上,数据中心目前主要承担AI训练任务,但AI将越来越多地转移到边缘。Jack Gold总结道:“因此,边缘系统必须经过优化,这样才能处理推理工作负载。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。