Dell PowerScale闪电项目实现并行化升级提速文件处理性能

戴尔在超级计算大会2025上宣布闪电项目已成功将PowerScale并行化,显著提升文件读写性能。通过pNFS和Flex Files布局支持,PowerScale实现了元数据服务器与客户端间的双向通信,在集群多个节点间实现更好的并行数据分布。新增NIXL库KV缓存卸载集成,支持软件订阅许可模式。ObjectScale新增AI优化搜索功能,包括S3表格和向量搜索API。

戴尔在超级计算2025大会上宣布,闪电项目已成功让PowerScale实现并行化处理,显著提升了文件读写性能,同时还发布了更多PowerScale和ObjectScale相关消息。

戴尔表示,通过这些以及其他AI工厂相关公告,戴尔与英伟达正在"通过戴尔AI工厂与英伟达的技术进步,为企业AI交付未来"。公司宣布了多项服务器、存储和网络产品增强功能,我们重点关注存储方面的进展。PowerScale是戴尔的横向扩展集群文件系统,搭载OneFS软件,其技术源于戴尔收购的Isilon前身产品。ObjectScale是戴尔的分布式、基于微服务的多节点横向扩展多租户对象存储软件,具有支持S3 API的单一全局命名空间。

在SC25大会上,戴尔宣布了并行PowerScale、PowerScale软件授权、面向PowerScale和ObjectScale的NIXL库KV缓存卸载集成,以及ObjectScale的AI优化搜索功能。

戴尔副董事长兼首席运营官杰夫·克拉克表示:"戴尔AI工厂与英伟达解决了每个企业都面临的问题:如何在不重建基础设施的情况下从AI试点转向生产。我们已经完成了集成工作,因此客户无需自行处理,这意味着他们可以更快部署并自信地扩展规模。"

PowerScale技术升级

PowerScale的闪电项目是一个近18个月的开发计划,旨在为PowerScale的OneFS操作系统添加并行IO功能。正如预期的那样,该项目通过使用pNFS(并行NFS)实现,为其数据服务器节点添加了元数据服务器和Flex Files布局支持。

戴尔表示,并行PowerScale在元数据服务器和客户端之间实现了双向通信,允许在PowerScale集群中的多个节点间更好地并行分布数据。这提供了吞吐量、性能提升以及通过集群中多个路径进行并行I/O的线性可扩展性。

PowerScale现在支持NIXL(英伟达推理传输库);这是英伟达的代码,用于加速AI推理框架中的点对点通信,如Dynamo(其低延迟KV缓存卸载引擎),并提供GPU和CPU内存以及文件、块和对象存储的抽象,具有模块化插件架构。PowerScale的NIXL支持实现了可扩展的KV缓存卸载。在131,000个Token的完整上下文窗口下,它实现了1秒的首Token时间(TTFT),比标准vLLM快19倍。

包括戴尔在内的许多存储供应商都表示支持Dynamo,如Cloudian、Cohesity DDN、日立Vantara、HPE、IBM、NetApp、PEAK:AIO、Pure Storage、VAST Data和WEKA。

PowerScale现在以仅软件、订阅许可的形式提供,可在合格的PowerEdge服务器(如戴尔PowerEdge R7725xd)上运行。这将帮助客户将PowerScale计算设施与PowerScale硬件+软件设备分开购买。

ObjectScale功能增强

两项AI优化搜索功能是S3表格和向量搜索API,旨在为分析和关键AI工作负载(如推理和检索增强生成RAG)提供更快的搜索速度。S3表格存储结构化数据,而向量是非结构化数据的数学表示。两者结合为直接存储在ObjectScale上的复杂数据提供高速访问。

亚马逊表示,"S3表格专门用于存储表格数据,如日常购买交易、流式传感器数据或广告展示。表格数据以列和行的形式表示数据,就像数据库表一样。"有多种方式可以将关系数据库中的数据导入S3表格。例如,可以使用AWS Glue或EMR与Spark作业定期移动数据。

产品可用性

戴尔ObjectScale和搭载英伟达Dynamo的PowerScale现已全球发布。软件定义的PowerScale将在2026年上半年全球发布。戴尔PowerScale并行NFS支持将在2026年全球发布。

技术背景

PowerScale目前运行OneFS操作系统,将文件系统、卷管理器和数据保护结合到在OneFS驱动的存储集群上运行的单一分布式软件层中。集群具有内部或后端网络,包括10Gb、40Gb或100Gb以太网,或低延迟QDR Infiniband(IB)。

客户端使用在所有节点上可用的以太网连接(10GbE、25GbE、40GbE或100GbE)连接到集群。此外,OneFS 9.10及更高版本在全闪存F910和F710平台上支持200GbE前端连接或HDR Infiniband加100Gb以太网。

单个集群由多个节点组成,最少4个,最多252个,这些节点是机架式企业设备,包含:内存、CPU、网络、以太网或低延迟Infiniband互连、磁盘控制器和存储介质。因此,分布式集群中的每个节点都具有计算和存储或容量能力。

平台节点分为三种类型:性能型、混合/实用型和归档型。

OneFS对带有Flex Files的pNFS的支持要求OneFS采用独立的元数据服务器(MDS)软件实体,与数据服务节点实体分离。

Q&A

Q1:戴尔PowerScale闪电项目是什么?它有什么作用?

A:闪电项目是戴尔为期近18个月的开发计划,旨在为PowerScale的OneFS操作系统添加并行IO功能。通过使用pNFS技术和元数据服务器,实现了数据在集群多个节点间的并行分布,显著提升了吞吐量和性能。

Q2:NIXL库对PowerScale有什么影响?

A:NIXL是英伟达推理传输库,PowerScale支持NIXL后可以实现可扩展的KV缓存卸载。在131,000个Token的完整上下文窗口下,能够实现1秒的首Token时间,比标准vLLM快19倍,大幅提升AI推理性能。

Q3:ObjectScale的S3表格和向量搜索API有什么用途?

A:这两项AI优化搜索功能旨在为分析和AI工作负载提供更快搜索速度。S3表格专门存储结构化数据如交易记录,向量搜索API处理非结构化数据的数学表示,两者结合为存储在ObjectScale上的复杂数据提供高速访问。

来源:BLOCKS & FILES

0赞

好文章,需要你的鼓励

2025

11/18

08:04

分享

点赞

邮件订阅