面向高功率智能算力新挑战,普洛斯数据中心给出弹性高效节能新技术 原创

当前算力已经成为数字经济发展的核心资源,特别是过去一年,AIGC的火热,让智能算力资源呈指数级增长

当前算力已经成为数字经济发展的核心资源,特别是过去一年,AIGC的火热,让智能算力资源呈指数级增长,使得数据计算、存储和应用需求快速扩张,高密度、高算力、高效能已成为算力基础设施的必然发展趋势。伴随着算力中心规模在不断扩大,业务需求短期内快速更迭,运维管理的复杂程度也相应增加。

与此同时,“双碳”目标,作为一场广泛而深刻的经济社会系统性变革的风向标,有力地引导经济社会发展全面向低碳绿色转型。在CDCC主办的第十一届数据中心标准大会上,普洛斯数据中心及美团联合申报的“智能算力中心弹性高效节能技术”荣获“2023年数据中心科技成果奖一等奖”。这是普洛斯数据中心继2021年凭借“数据中心多系统预制化技术”荣获一等奖之后,再次荣膺数据中心领域国家级奖项。

那么当前智算数据中心能耗特点是什么?对于数据中心的建设及运营管理提出了哪些新的要求?如何实现绿色低碳转型?近日,普洛斯数据中心给出专业的答案。

高功率智能算力给数据中心带来全新革命

随着人工智能(AI)数据量不断增多,数据中心发展速度也会更快。单体数据中心对资源的需求越来越大,对绿色节能的要求也越来越高。这势必给算力发展带来新的革命。

“今天科技革命,我们认为主要改变的一个是效率,一个是成本。今天AI在工具的维度,将计算的效率提升了一个数量级,这是一个重大的革新,涵盖了单机更高功率密度、单位算力能耗更低、短距离低时延和更可靠的GPU互联。”普洛斯数据中心平台产品部副总裁韩玉分享到。

当前智算中心的一个显著特点就是高功率集群。韩玉表示,“跟云计算相比,智算中心更多的是一种纯算力处理器的堆叠集群。传统服务器里既有CPU又有内存和硬盘,是个综合体,但今天智算服务器里会堆叠8张计算卡。也就是说,以往一台传统服务器功率可能是500瓦到700瓦,今天一台AI服务器功率可以达到10千瓦,是一个数量级的提升。”

其次,算力和算力之间的高效传输带来了能效的变革。传统的服务器在短距离网络互联传输需求上,通过网卡转换,速率较慢。今天因为芯片厂商的革新,通过专用的GPU直连GPU,算力延时降低和带宽大幅度提升,所以AI算力之间的效率对于传统CPU算力效率而言,也是数量级的改变。

针对算力集群的集中带来的高密度挑战,弹性设计是必不可少的。数据中心需要迅速适应各种需求变化,并保持系统的稳定性。对此,韩玉表示:“原来云计算做到单机柜功率8-12千瓦就可以了,但是在今天的智算场景中,一台算力服务器就是10千瓦,业界已经出现单机柜功率60-80千瓦的大规模算力集群。我们要解决机柜功率高密度以及网络短距离的挑战,以及匹配算力集群之外较低功率的存储集群和网络集群等的混合部署需求。”

这些挑战也影响着智算中心的架构和运维的创新,比如建筑单体会更大,比如机电要求更高效,集群要实现更快速的交付。因为集群越来越大,对运营的稳定可靠性,对运营系统智能化、数字化的要求也越来越高。

“智能算力中心弹性高效节能技术”助力打造智算中心新标杆

普洛斯数据中心聚焦智算领域,持续升级和优化智算中心相关解决方案,在提供高算力服务的同时,实现节能降耗,打造绿色高效、低碳和智能运营的新一代智算数据中心。

本次获奖的“智能算力中心弹性高效节能技术”,能在众多参评项目中脱颖而出,在于该技术解决方案面向AIGC时代的智能算力需求,顺应智算中心高效绿色发展的行业趋势,创新性综合了算力服务器、高性能网络技术、高效制冷设备、建筑与冷站预制技术、自研智能运营平台等多项高效、低碳、不同密度弹性布局的定制技术和解决方案,助力客户打造绿色、高效、智能、极简的智能算力中心,突破高算力发展能效的瓶颈。

“智能算力中心弹性高效节能技术”能够敏捷灵活应对高性能算力集群同时部署、分期上线、快速交付等多方面的挑战,并且高效配合运维管理系统,切实满足客户快速部署大规模算力集群应用场景、促进业务创新的需求。

目前,该技术已应用于普洛斯数据中心旗下某智算中心园区,该智算中心园区由普洛斯数据中心与客户共同定制,用于承载大数据模型算力集群业务,以GB50174等级、LEED金级绿色建筑等级以及行业5A绿色认证等级要求进行高标准交付。

项目构建了算力集群的IT架构和基础设施的弹性架构,包括兼容大规模高性能算力服务器和通用CPU服务器并部署客户自研伯努利机柜,可以适配两种计算模型的弹性网络架构,从10kW-40kW机柜密度的组合和弹性布局,风冷和液冷系统兼顾的制冷方案和建筑设计,配合GLP DC BASE智慧化运营系统,是新一代智算中心实现可用、好用、节能、绿色设计、高效运营的创新尝试,为智算中心建设树立了行业新标杆。

在助力实现“双碳”目标方面,普洛斯数据中心联合客户研发的“智能算力中心弹性高效节能技术”方案,依靠技术和创新的新模式,不仅降低能源消耗,同时敏捷灵活应对高性能算力集群同时部署、分期上线、快速交付等多方面的挑战,并且高效耦合运维管理系统,切实满足客户能够快速部署大规模算力集群应用场景、促进业务创新的需求。

智算中心高效运营的核心引擎 - GLP DC BASE

GLP DC BASE是普洛斯自主研发的面向多数据中心的中央统一管控平台,采用了业内领先的中心化管控模式,深度结合数字孪生技术与AI算法模型,整合数字化监控和智慧化运维,实现了对数据中心机房内动力、环境、安防等方面的整体智慧化管理。

“GLP DC BASE接入了数据中心里每一个电力暖通系统,是一个提升大型数据中心运营的智慧化运营管理系统。通过应用这套运营系统,客户可以看到能效的提升,比如说不加这套系统的PUE是1.3,经过一些优化可以实现1.2,这就是优化的价值。” 韩玉分享到,GLP DC BASE作为一个运营系统,其重要的价值是把数据直接传给客户,而且可以用于后续运营的持续优化。

此外,普洛斯数据中心将AI和运维专家的经验嵌入GLP DC BASE智慧化运营管理系统中,将电力的功耗和智能系统进行匹配,并逐步迭代优化。GLP DC BASE平台能够实时监测和分析数据中心的能耗、温湿度、功率、负载等多维度运维指标,通过AI算法优化机房设备的调节策略,提高能源利用效率,降低能耗成本。同时,平台还能够通过预测分析和故障诊断,提前预警和处理潜在风险,保障数据中心的安全可靠运行。

为应对市场及客户需求,目前普洛斯数据中心已在华北、华东区域初步完成了智算集群的落地。普洛斯数据中心基于弹性、绿色、高效的技术架构,多预制快速交付能力,支撑安全稳定运营的智慧化运营系统,能够为客户提供全生命周期智算基础设施服务,为AIGC时代的发展提供有力的支持。

可以看到,作为中国领先的独立数据中心运营商之一,普洛斯数据中心将凭借创新低碳技术应用、快速交付能力、智慧化低碳化运营专长,为客户提供高性能、高质量智能算力服务,打造新一代智算数据中心,持续推动行业技术创新和绿色发展。

来源:至顶网存储频道

0赞

好文章,需要你的鼓励

2024

01/10

10:29

分享

点赞

邮件订阅