导语:底层数据基础设施需求的变化,叠加科研领域对于数据流动的需求,愈发需要适应HPDA场景的存储解决方案。华为推出的科研HPDA存储解决方案,基于教学、科研业务特点对计算、存储、网络进行调优,真正可以做到存得省、算得快、用得好,为高校科研中心筑造坚实数据基座。
当下,教育信息化为教育发展注入新动能,已成为衡量一个国家教育高质量发展的重要内容。高校和基础教育信息化的基础设施建设水平,对转变教育思想和观念、促进教学改革、加快教育发展和管理手段的现代化起着积极作用。高校依托高性能计算平台推动教育数字化转型。由于高性能计算平台对高校科研有着非常重要的支撑作用,高校纷纷建立自己的超算平台。混合计算则需要更加牢固且强大的、支持HPDA(High Performance Data Analytics)场景的可靠存储底座。

从分散建设到集约化建设
过去,各高校分散建设若干个超算小平台,能够支持单个院系或课题组的计算需求。但由于每一个院系都独立建设平台,计算资源存在难以共享、利用率低、规模较小的问题;机房环境方面,则面临缺乏专用机房、供电缺乏保障、能耗故障率高的问题。另外,更关键的是,缺乏专业的运维人员,现有运维人员的水平参差不齐,安全问题容易被忽视。
随着教育信息化的推进,类似问题不断突显。为逐步解决问题,中国教育部等六部门在2021年7月发布《关于推进教育新型基础设施建设构建高质量教育支撑体系的指导意见》,明确指出教育要向数据驱动、协同治理、主动服务转变。教育新基建要聚焦智慧校园新型基础设施、高校科研高性能装备的共享集约建设,构建集约高效、安全可靠的教育新型基础设施体系。
全球对教育基础设施建设的投入正在加速。2018年,欧盟提出“欧洲高性能计算共同计划”(EuroHPC JU),协调欧盟与成员国集中资源,计划从2019年至2026年投资10亿欧元,建立一个由世界级高性能计算和数据基础设施支撑的欧洲高性能计算及大数据系统。2020年,该数字已升级到80亿欧元,旨在此基础上增强高校科研中心培育、发展科学计算以及面向超级计算交叉学科的研究。
全光园区方案为多个教育场景赋能
高性能计算的发展离不开“算力”与“数据”的调配。算力作为动力,是驱动社会数字化转型的引擎;而数据作为基座,在每一次吐故纳新之中,是计算强劲运转的燃料。随着数字经济的发展,数据和算力的关系正在发生转变。
以前,是数据跟着算力跑。为了应对复杂科学和工程问题的快速数值求解,过去半个世纪,数据仅作为算力的配套设施来考虑,业界更多关注的是如何打造最强大的算力。
如今,已演变成算力围着数据转。多样性算力为高性能计算提供了更多更丰富的计算资源选项,打破了算力瓶颈。存力的演进已经赶不上算力的高速增长的步伐,影响着算力更好的发挥。高性能计算的重心开始从以计算为核心,向以数据为中心的计算演进,多种异构算力紧密围绕在同一个数据存储周围。
因此,超算平台也从“数据跟着算力跑”变为“算力围着数据转”。数据正在迅速改变科研领域,推动传统科研模式加速向基于“数据密集型科学”的科研新范式转变。数据密集型的科研应用负载,其数据往往具有不可重复性、高度不确定性、高维计算高度复杂等特征,同时对于底层数据基础设施的需求将也发生根本性改变,加上当前科研领域对于数据流动的需求愈发强烈,使得教育科研领域的HPDA面临着四重挑战。
其一,混合计算需要更加牢固且强大的、支持HPDA场景的可靠存储底座。众所周知,无论是高校科研机构的智算中心,还是辐射区域的政府超算中心,均需要同时跑不同类型的科研应用负载。HPC在不同流程阶段面临带宽型、OPS型业务负载需求,HPDA场景下这一情况会更加常态化,传统存储仅支持单一负载模型,形成了性能孤岛,使得流程间的数据需要在不同存储间迁移,降低了整体流程效率。因此,需要强大的HPDA数据存储同时支撑起这些混合工作负载,并减少数据量膨胀以及数据迁移。
其二,随着教育科研HPDA研究的课题的拓宽,数据量也在不断增加,这对机房空间、功耗、存储成本都提出了新的挑战。从PB级向EB级的演进,海量数据的价值需要被进一步挖掘,用户愿意更长久地保留数据。因此HPDA数据存储如何借助高密、高效冗余、热温冷分级、重删压缩等技术降低存储成本成为刚需。
其三,在HPDA场景中,不同的系统需要不同的存储服务来支持。例如,在以基因测序为代表的HPDA场景中,不同的流程阶段可能用到文件、大数据、对象多种服务,如何实现流程的高效数据访问成为用户面临的一大挑战。这就需要HPDA存储提升多应用协同分析效率,促进学科交叉融合发展,一套系统支持多种协议,实现数据互通,减少中间环节,并且资源统一管理和运维,支撑业务敏捷响应。
其四,很多HPDA工作负载对于数据实时处理性能要求很高,在高能物理分析、天气预测、药物研究等场景中,往往会面对大规模网络并发数据处理需求,需要短时间内对海量数据进行快速分析与处理,这对于HPDA场景下存储系统的高效处理能力提出了极高要求。
随着HPC向数据密集型HPDA演进,业界普遍意识到,需要打造支持混合负载、多协议互通且具备超高密设计、面向HPDA场景的存储解决方案,来应对HPDA工作负载愈发严苛的挑战。存储逐步成为教育科研HPDA解决方案中最重要的一环。
追求卓越的新一代存储解决方案
华为凭借多年来对教育科研行业的深入理解和不断积累,推出科研HPDA存储解决方案。该解决方案以OceanStor Pacific分布式存储、并行文件系统为核心,基于教学、科研业务特点对计算、存储、网络进行调优,从而形成场景化的科研高性能数据分析解决方案,真正可以做到存得省、算得快、用得好。
存得省:海量数据存储,满足未来百PB级增长需求。
OceanStor Pacific全新推出了系列化超高密硬件,支持不同硬件间的数据自动分级,单位空间容量提升20%,全面降低HPC场景的存储成本。OceanStor Pacific系列高密大容量产品在5U空间里支持120个3.5寸HDD硬盘,通过高密实现60%以上的机柜空间节省,让海量数据不再成为负担。
算得快:新一代分布式文件系统/DPC并行客户端,突破单流、单客户端瓶颈。
OceanStor Pacific系列存储搭载新一代分布式文件系统以及DPC(Distributed Parallel Client)私有客户端,一套存储即可实现2倍大文件高带宽,5倍小文件高IOPS性能,大大提高性能水平。同时该文件系统也能支持多种业务负载,既能兼顾客户原有的常规业务,也能很好适配企业对大数据和AI等新业务的探索,实现面向混合负载的全场景加速。
用得好:一份数据无需迁移,最大限度降低用户运维复杂度,提升系统可用性。
OceanStor Pacific系列存储能够匹配多样化算力需求,提升多应用协同分析效率,促进学科交叉融合发展,一套系统支持多种协议,实现数据互通,减少中间环节,并且资源统一管理和运维,支撑业务敏捷响应。
上海交大“交我算”计算平台使用华为OceanStor Pacific分布式存储,利用大小I/O自适应处理技术,数据智能分级流动,让原先3个月完成的计算量缩短至4天。
教育科研HPDA场景推动了分布式存储架构的改变,而华为存储也不断进行创新,从而匹配HPDA场景下的新业务的需求,为高校科研中心筑造坚实的HPDA数据基座。越是基础的就越是核心的,无论是HPDA所要解决的问题,还是存储技术的突破,都再次证明了这一论断。华为存储将在教育科研HPDA场景持续探索,从硬件到软件、从算法到架构统一进行持续创新,在可靠性、可用性、易用性等多方面不断追求卓越。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。