2022年12月12日-15日,第十八届全国高性能计算学术年会(CCF HPC China 2022)在线上举办。华为DataRobot HPDA存储集群解决方案凭借出色的应用加速、数据跨域管理和全栈敏捷设计能力,荣获最佳解决方案奖。华为HPDA存储集群解决方案首席架构师郭洪星围绕《HPDA存储集群:以数据存储创新,助超算高质量发展》发表主题演讲。
新型应用与东数西算战略为超算系统带来挑战
随着新型应用日新月异、东数西算工程加速推进,超算系统面临的挑战也愈加艰巨。
首先,新型应用带来的大规模网络并发需求、系统可靠性问题,及少量存储节点慢导致的短木板效应,都对存储系统的全栈协同、高效处理能力提出了更高的要求。
其次,在东数西算、东数西存的牵引下,跨地域、跨集群的数据共享与流动也带来了数据管理、流动、使用方面的困难以及安全可信的问题。
郭洪星表示,面向多元算力和海量数据的数据密集型超算(HPDA)已成为产业共识,支持混合负载、多协议互通,具备超高密设计已成为业界对HPDA存储系统的基本要求,为迎接高性能计算所面临的全新挑战,华为打造了业界首个数据加速引擎加持的HPDA全栈方案—华为DataRobot HPDA存储集群解决方案,满足海量数据跨地域高性能处理的要求。
数据应用加速:DataTurbo应用加速引擎,使能HPDA应用极致性能
DataTurbo是华为DataRobot HPDA存储集群解决方案中联接应用与存储的数据加速引擎组件,由应用加速引擎和全局数据管理组件组成。
应用加速引擎内置了自研网卡芯片和HPC、大数据加速套件,具备I/O聚合算法、统一元数据网关、芯片I/O卸载等黑科技,可实现应用处理效率数倍提升,同时结合OceanStor存储的全局共享存储能力,在面向E级超算场景下,可实现万级计算客户端并发访问,且单集群达到50TB/s带宽,10亿IOPS能力,性能领先业界30%。
数据跨域管理:DataTurbo全局数据管理组件,提升跨域数据调度效率
全局数据管理组件可以基于统一元数据,构建全局命名空间,实现跨数据统一访问;支持智能的全文检索,打破地域限制,让数据看得见;并可通过智能调度策略,根据数据温热冷分级,可实现3倍数据调度效率提升。
一站式交付快速上线,统一运维,解决数据管理难的问题
华为DataRobot HPDA存储集群方案提供了包含基础柜、计算柜和存储柜在内的三类模块化硬件组合,基于最佳实践的典配机柜设计,不同规模业务场景可按需选择部署、灵活扩展。同时具备一站式交付能力,可帮助用户业务上线时间缩短50%。
该方案还提供全栈统一运维平台,能够将多个数据中心的存储、计算、网络、容器等资源统一管理,实现管理“一张网”;同时提供从资源规划、端到端资源发放、设备运维,到资源优化全生命周期管理及AI智能运维,相比传统管理模式,能够实现5倍的管理效率提升和分钟级问题定界,帮助企业实现运维管理无忧。
好文章,需要你的鼓励
数字孪生技术正在改变网络安全防御模式,从被动响应转向主动预测。这种实时学习演进的虚拟副本让安全团队能够在威胁发生前预见攻击。组织可以在数字孪生环境中预演明日的攻击,将防御从事后反应转变为事前排演。通过动态更新的IT生态系统副本,团队可在真实条件下压力测试防御体系,模拟零日漏洞攻击并制定应对策略,从根本上重塑网络安全实践方式。
香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、娱乐、医疗、安防等领域的视频AI应用开启新可能。
Linux内核开发面临动荡时期,Rust语言引入引发摩擦,多名核心开发者相继离职。文章介绍了三个有趣的替代方案:Managarm是基于微内核的操作系统,支持运行Linux软件;Asterinas采用Rust语言开发,使用新型framekernel架构实现内核隔离;Xous同样基于Rust和微内核设计,已有实际硬件产品Precursor发布。这些项目证明了除Linux之外,还有许多令人兴奋的操作系统研发工作正在进行。
Atla公司发布Selene Mini,这是一个仅有80亿参数的AI评估模型,却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略,该模型不仅能准确评判文本质量,还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源,为AI评估技术的普及和发展做出贡献。