2022年12月12日-15日,第十八届全国高性能计算学术年会(CCF HPC China 2022)在线上举办。华为DataRobot HPDA存储集群解决方案凭借出色的应用加速、数据跨域管理和全栈敏捷设计能力,荣获最佳解决方案奖。华为HPDA存储集群解决方案首席架构师郭洪星围绕《HPDA存储集群:以数据存储创新,助超算高质量发展》发表主题演讲。
新型应用与东数西算战略为超算系统带来挑战
随着新型应用日新月异、东数西算工程加速推进,超算系统面临的挑战也愈加艰巨。
首先,新型应用带来的大规模网络并发需求、系统可靠性问题,及少量存储节点慢导致的短木板效应,都对存储系统的全栈协同、高效处理能力提出了更高的要求。
其次,在东数西算、东数西存的牵引下,跨地域、跨集群的数据共享与流动也带来了数据管理、流动、使用方面的困难以及安全可信的问题。
郭洪星表示,面向多元算力和海量数据的数据密集型超算(HPDA)已成为产业共识,支持混合负载、多协议互通,具备超高密设计已成为业界对HPDA存储系统的基本要求,为迎接高性能计算所面临的全新挑战,华为打造了业界首个数据加速引擎加持的HPDA全栈方案—华为DataRobot HPDA存储集群解决方案,满足海量数据跨地域高性能处理的要求。
数据应用加速:DataTurbo应用加速引擎,使能HPDA应用极致性能
DataTurbo是华为DataRobot HPDA存储集群解决方案中联接应用与存储的数据加速引擎组件,由应用加速引擎和全局数据管理组件组成。
应用加速引擎内置了自研网卡芯片和HPC、大数据加速套件,具备I/O聚合算法、统一元数据网关、芯片I/O卸载等黑科技,可实现应用处理效率数倍提升,同时结合OceanStor存储的全局共享存储能力,在面向E级超算场景下,可实现万级计算客户端并发访问,且单集群达到50TB/s带宽,10亿IOPS能力,性能领先业界30%。
数据跨域管理:DataTurbo全局数据管理组件,提升跨域数据调度效率
全局数据管理组件可以基于统一元数据,构建全局命名空间,实现跨数据统一访问;支持智能的全文检索,打破地域限制,让数据看得见;并可通过智能调度策略,根据数据温热冷分级,可实现3倍数据调度效率提升。
一站式交付快速上线,统一运维,解决数据管理难的问题
华为DataRobot HPDA存储集群方案提供了包含基础柜、计算柜和存储柜在内的三类模块化硬件组合,基于最佳实践的典配机柜设计,不同规模业务场景可按需选择部署、灵活扩展。同时具备一站式交付能力,可帮助用户业务上线时间缩短50%。
该方案还提供全栈统一运维平台,能够将多个数据中心的存储、计算、网络、容器等资源统一管理,实现管理“一张网”;同时提供从资源规划、端到端资源发放、设备运维,到资源优化全生命周期管理及AI智能运维,相比传统管理模式,能够实现5倍的管理效率提升和分钟级问题定界,帮助企业实现运维管理无忧。
好文章,需要你的鼓励
Workday高管指出,企业必须从传统的资历导向转向技能导向策略,才能成功整合AI智能体到workforce中。AI智能体应被视为具有特定技能的"数字员工",需要经历完整的员工管理生命周期,包括招募、培训、发展和离职规划。调研显示,新加坡超过40%的企业已开始采用技能导向策略,其中约60%报告了创新提升等益处。企业应建立统一的治理系统来管理人类员工和AI智能体,确保两者协同工作而非相互替代。
沙特TachyHealth团队开发的32亿参数医疗AI模型Gazal-R1,通过创新的双阶段训练方法在医疗推理任务上超越了12倍大的模型,在MedQA等测试中取得87.1%的优异成绩,展现了精巧训练策略胜过规模扩张的重要启示,为资源有限的医疗AI研究提供了新路径。
Songscription公司发布AI音乐转录工具,可在几分钟内将音频文件转换为乐谱。该产品采用免费增值模式,面向专业和业余音乐家。目前主要支持钢琴转录,未来计划增加吉他谱等功能。用户可上传音频文件或直接从YouTube链接进行转录,系统还能生成钢琴卷帘谱。公司定位为增强型音乐记谱软件,帮助用户加速转录过程。该初创公司已获得Reach Capital的预种子轮融资。
奥地利维也纳医科大学研究团队开发了RetFiner技术,通过让眼科AI模型同时学习OCT图像和医疗文字描述,显著提升了诊断准确率。该方法采用四种训练任务让AI模型建立图像与文字的深层联系,在三个主流眼科AI模型上实现了2-6个百分点的性能提升,为医学AI发展开辟了新方向。