Cray宣布推出了一款适用于高性能计算的全闪存阵列L300F,可用作ClusterStor的提速器使用。
ClusterStor是运行Lustre的横向扩展式集群存储阵列,采用L300纯磁盘和L300N闪存/磁盘混合模式。
随着闪存阵列领导者Cray打造出超快速的NVMe系统,得到高性能并行文件系统磁盘阵列支持的传统高性能计算阵列制造商以相对较慢的SSD阵列进入闪存阵列市场。
Cray的L300F属于L300系列阵列,使用双端口SAS SSD对全闪存阵列进行改造,支持以太网、InfiniBand或OPA主机端口。
与其他L300产品一样,L300F同时支持对象存储服务器和目标存储。Cray表示,它采用高可用性设计,可以线性扩展,在集群不断增加节点的情况,性能不会出现损失。
L300F采用双控制器、2U x 24驱动器配置,提供500000 IOPS性能。其他L300阵列采用较大的5U x 84插槽机箱来容纳磁盘。L300F的容量为76.8TB(采用3.2TB SSD)和38.4TB(采用1.6TB驱动器)。
E8和Excelero NVMe-oF阵列的IOPS性能超过100万,NetApp的A800也是如此,所以Cray的L300F似乎有些逊色。
Lustre是开源的、可扩展的并行文件系统,在超级计算领域的集群计算中很流行。Lustre与其他并行文件系统(如IBM Spectrum Spectrum,GPFS)相竞争。Cray今天也宣布,L300F将支持Lustre 2.11版本。
Cray把L300F定位为Lustre存储池中的高性能组件,这个存储池采用以容量为中心的L300s以实现大型顺序IO,采用闪存/磁盘混合配置的L300N用于混合随机IO。L300F的主要用途是支持Lustre文件系统中临时存储池的高IOPS,从而加速磁盘IO的应用运行时间。
Cray表示,此前过量配置磁盘以提高IO率的方法不仅成本高,而且在面对闪存延迟更低的情况下更显不足。
对于Cray而言,L300F为标准硬盘池增添了闪存存储池,且针对需要高性能的工作流(中间结果(IOPS)以及保存最终结果(高带宽)进行了优化。Cray称,系统管理员使用L300F可以管理单个文件系统,而不是单独对闪存和磁盘进行管理。
Cray称L300F引领超级计算环境。从其性能数据来看,与NVMe驱动器阵列和NVMe-oF访问的阵列相比L300F在商业数据中心的应用并不多。
而且NVMe技术也正在进入高性能计算领域。E8和Excelero的NVMe-oF存储都可以在高性能计算环境中支持Spectrum Scale。英特尔也致力于开发Lustre和NVMe存储。
Cray可能需要重新审视其ClusterStor的开发并投入对NVMe的支持(如果这部分还不在路线图规划中的话)。
Cray View for ClusterStor管理工具提供了对Lustre作业、网络状态和存储系统性能的端到端视图。它提供了有关作业运行时变化、事件关联和趋势分析的信息,以及基于选定测量标准的自定义警报功能。
ClusterStor L300F及其所需的Neo 3.1 ClusterStor软件将在8月底前提供。
好文章,需要你的鼓励
亚马逊云服务部门与OpenAI签署了一项价值380亿美元的七年协议,为ChatGPT制造商提供数十万块英伟达图形处理单元。这标志着OpenAI从研究实验室向AI行业巨头的转型,该公司已承诺投入1.4万亿美元用于基础设施建设。对于在AI时代竞争中处于劣势的亚马逊而言,这项协议证明了其构建和运营大规模数据中心网络的能力。
特拉维夫大学研究团队开发了SAEdit方法,使用稀疏自编码器实现精确的AI图像编辑控制。该技术能像调节音量一样精确控制编辑强度,实现从微笑到大笑的连续调节,同时确保编辑的高度解耦性,避免意外修改其他图像元素。方法具有出色的通用性,可应用于多个AI图像生成平台,为图像编辑领域带来重大突破。
当今最大的AI数据中心耗电量相当于一座小城市。美国数据中心已占全国总电力消费的4%,预计到2028年将升至12%。电力供应已成为数据中心发展的主要制约因素。核能以其清洁、全天候供电特性成为数据中心运营商的新选择。核能项目供应链复杂,需要创新的采购模式、标准化设计、早期参与和数字化工具来确保按时交付。
Code4Me V2是荷兰代尔夫特理工大学开发的开源AI编程助手平台,专为学术研究设计。它解决了商业AI编程工具透明度不足、无法获取交互数据的问题,提供了模块化架构和完整的数据收集框架。该工具性能可媲美商业产品,代码补全延迟仅186.31毫秒,同时支持内联补全和聊天功能。通过透明、可控制、可扩展的设计,为AI辅助编程研究提供了重要的基础设施平台。