空气动力学、空间技术的开发;长期气候预测、高精度天气预报、海洋环流计算、空气与水污染的模拟分析、洪水与地震等灾害的预报;发动机设计、模具设计、生物新药设计、风洞试验仿真、石油地质勘探及新材料研究……所有这些与HPC(High Performance Computing,高性能计算)都紧密相关。
发展速度极快、应用愈发广泛,这就是HPC当前的现状。之所以会呈现这样的态势,主要是出于两方面的原因。一是需求促使,当下是数据社会,数据量越来越大、再加上人们对数据分析效率的追求越来越高,需要更强大的计算力做支撑;二是技术进步,信息技术这些年发展很快,HPC资源的获取之前需要大量的人力、物力投入,而现在以比较小的代价就能享受其强大的能力。
二者相互交织、促进,使得越来越多的行业开始使用HPC,感受HPC带来的变革。这其中,高等教育行业绝对是一个典型。粗略统计了一下今年6月发布的全球高性能计算机(HPC)TOP500榜单,其中有41套归属于大学,占比超过8%,分量可想而知。
为什么高教行业对HPC的需求那么强烈?与HPC快速普及的原因一脉相承,但高教的特点更突出。
拿汽车制造业来说,汽车生产企业会利用HPC进行车辆设计,而高校也会有相应的课程,也会用到HPC,二者都有需求。所不同的是汽车制造商只利用HPC干汽车制造这一件事,而高校还会有物理、化学、生物等其它学科需要HPC的能力。也就是说,相比企业,高校在HPC领域的应用范畴更广。到此,也就不难理解为什么HPC能在高教行业发展如此之快了。
EPFL出难题
为了更进一步探讨高教对HPC的使用情况,这里举一个实际案例,瑞士洛桑联邦理工学院(EPFL) 。
EPFL,世界顶级高校,QS世界大学排名第12,工程技术领域和自然科学领域享有极高的声望,拥有来自全球120个国家和地区的学生、教授和职员。为了保持业界领先的科研水平,EPFL一直在加强HPC系统的建设,早在2008年就建设了第一套HPC系统服务于全校师生。

着眼于未来的竞争力提升,从去年开始EPFL就计划对其HPC系统进行升级扩容。升级的理由很简单,资源不够用了。在EPFL给出的需求表中,最显眼的一栏是应用需求,HPC benchmark、HPL、HPCG等基准测试要满足;科学、工程、生物、医疗等各种应用,其中既有EPFL自行开发的也包括开源的都要能运行。
除此之外,还有很多硬性条件,比如理论计算能力≥475TFlops,共享存储≥340TB,读写带宽40G/s,整个系统不能超过8个机柜,单机柜功耗不能高于25kw;系统要开放、易管理、易扩展,而且合作伙伴要有足够的技术前瞻性,能为EPFL未来5年建设5PF HPC集群的总目标提供足够的支撑力。
华为见招拆招
单独看某一方面的需求可能还比较好满足,但如果把所有需求都集中在一起,会发现这块骨头并不好啃。没有压力也就没有动力,华为和当地系统集成商Transtec迎难而上,经过多次详细分析,最终给出了现在的方案,拓扑图如下:

其中,计算节点采用408个FusionServer XH620,每个节点是两路至强E5-2690 v4处理器,理论计算峰值475.2TFlops,网络采用2层Fat-Tree组网,Infiniband高速网络,存储系统是6套OceanStor 5800+GPFS并行文件系统,容量计350TB。
在这套方案中,华为采用了很多领先的产品和技术,带来的效果也十分显著。比如华为X6800高密度服务器的应用,使得单机柜计算能力提升70%的同时,机柜的部署数量也节省了40%。因为X6800在4U空间内能最高容纳8个计算节点、16路处理器,而采用普通的1U双路服务器则需要8U空间。这样一来,408个计算节点只需要6个机柜就能满足,而不是10个。
再比如,X6800中采用的散热工程设计,再加上DEMT动态节能技术,使得能耗比传统机架服务器降低10%-20%。
更多特性不再一一列举。凭借高效、高性能、高可扩展性、易管理等特性,华为的这套方案受到认可并得以部署。而从现在的实际应用情况看,这套方案完全满足用户需求,402TFLOPS的实测数据,计算效率达到89.3%。

今年6月,EPFL与华为共同宣布其科学IT和应用支持(SCITAS)部的Fidis HPC集群成功上线。
EPFL SCITAS执行董事Vittoria Rezzonico女士在接受采访时对华为给予高度评价。她说:"Transtec和华为紧密合作,为EPFL提供了一个顶级高质量的系统,很好地满足了我们在高性能计算学术领域的需求。华为技术工程师为我们介绍的出色的硬件解决方案以及Transtec专业的规划、安装和配置服务,让我们印象非常深刻。"
目前,华为的产品和解决方案已经应用于170多个国家和地区,服务全球1/3的人口。在全球财富500强中有172家,全球财富100强中有43家领先企业选择了华为作为数字化转型的伙伴。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。