戴尔在超级计算2025大会上宣布,闪电项目已成功让PowerScale实现并行化处理,显著提升了文件读写性能,同时还发布了更多PowerScale和ObjectScale相关消息。
戴尔表示,通过这些以及其他AI工厂相关公告,戴尔与英伟达正在"通过戴尔AI工厂与英伟达的技术进步,为企业AI交付未来"。公司宣布了多项服务器、存储和网络产品增强功能,我们重点关注存储方面的进展。PowerScale是戴尔的横向扩展集群文件系统,搭载OneFS软件,其技术源于戴尔收购的Isilon前身产品。ObjectScale是戴尔的分布式、基于微服务的多节点横向扩展多租户对象存储软件,具有支持S3 API的单一全局命名空间。
在SC25大会上,戴尔宣布了并行PowerScale、PowerScale软件授权、面向PowerScale和ObjectScale的NIXL库KV缓存卸载集成,以及ObjectScale的AI优化搜索功能。
戴尔副董事长兼首席运营官杰夫·克拉克表示:"戴尔AI工厂与英伟达解决了每个企业都面临的问题:如何在不重建基础设施的情况下从AI试点转向生产。我们已经完成了集成工作,因此客户无需自行处理,这意味着他们可以更快部署并自信地扩展规模。"
PowerScale技术升级
PowerScale的闪电项目是一个近18个月的开发计划,旨在为PowerScale的OneFS操作系统添加并行IO功能。正如预期的那样,该项目通过使用pNFS(并行NFS)实现,为其数据服务器节点添加了元数据服务器和Flex Files布局支持。
戴尔表示,并行PowerScale在元数据服务器和客户端之间实现了双向通信,允许在PowerScale集群中的多个节点间更好地并行分布数据。这提供了吞吐量、性能提升以及通过集群中多个路径进行并行I/O的线性可扩展性。
PowerScale现在支持NIXL(英伟达推理传输库);这是英伟达的代码,用于加速AI推理框架中的点对点通信,如Dynamo(其低延迟KV缓存卸载引擎),并提供GPU和CPU内存以及文件、块和对象存储的抽象,具有模块化插件架构。PowerScale的NIXL支持实现了可扩展的KV缓存卸载。在131,000个Token的完整上下文窗口下,它实现了1秒的首Token时间(TTFT),比标准vLLM快19倍。
包括戴尔在内的许多存储供应商都表示支持Dynamo,如Cloudian、Cohesity DDN、日立Vantara、HPE、IBM、NetApp、PEAK:AIO、Pure Storage、VAST Data和WEKA。
PowerScale现在以仅软件、订阅许可的形式提供,可在合格的PowerEdge服务器(如戴尔PowerEdge R7725xd)上运行。这将帮助客户将PowerScale计算设施与PowerScale硬件+软件设备分开购买。
ObjectScale功能增强
两项AI优化搜索功能是S3表格和向量搜索API,旨在为分析和关键AI工作负载(如推理和检索增强生成RAG)提供更快的搜索速度。S3表格存储结构化数据,而向量是非结构化数据的数学表示。两者结合为直接存储在ObjectScale上的复杂数据提供高速访问。
亚马逊表示,"S3表格专门用于存储表格数据,如日常购买交易、流式传感器数据或广告展示。表格数据以列和行的形式表示数据,就像数据库表一样。"有多种方式可以将关系数据库中的数据导入S3表格。例如,可以使用AWS Glue或EMR与Spark作业定期移动数据。
产品可用性
戴尔ObjectScale和搭载英伟达Dynamo的PowerScale现已全球发布。软件定义的PowerScale将在2026年上半年全球发布。戴尔PowerScale并行NFS支持将在2026年全球发布。
技术背景
PowerScale目前运行OneFS操作系统,将文件系统、卷管理器和数据保护结合到在OneFS驱动的存储集群上运行的单一分布式软件层中。集群具有内部或后端网络,包括10Gb、40Gb或100Gb以太网,或低延迟QDR Infiniband(IB)。
客户端使用在所有节点上可用的以太网连接(10GbE、25GbE、40GbE或100GbE)连接到集群。此外,OneFS 9.10及更高版本在全闪存F910和F710平台上支持200GbE前端连接或HDR Infiniband加100Gb以太网。
单个集群由多个节点组成,最少4个,最多252个,这些节点是机架式企业设备,包含:内存、CPU、网络、以太网或低延迟Infiniband互连、磁盘控制器和存储介质。因此,分布式集群中的每个节点都具有计算和存储或容量能力。
平台节点分为三种类型:性能型、混合/实用型和归档型。
OneFS对带有Flex Files的pNFS的支持要求OneFS采用独立的元数据服务器(MDS)软件实体,与数据服务节点实体分离。
Q&A
Q1:戴尔PowerScale闪电项目是什么?它有什么作用?
A:闪电项目是戴尔为期近18个月的开发计划,旨在为PowerScale的OneFS操作系统添加并行IO功能。通过使用pNFS技术和元数据服务器,实现了数据在集群多个节点间的并行分布,显著提升了吞吐量和性能。
Q2:NIXL库对PowerScale有什么影响?
A:NIXL是英伟达推理传输库,PowerScale支持NIXL后可以实现可扩展的KV缓存卸载。在131,000个Token的完整上下文窗口下,能够实现1秒的首Token时间,比标准vLLM快19倍,大幅提升AI推理性能。
Q3:ObjectScale的S3表格和向量搜索API有什么用途?
A:这两项AI优化搜索功能旨在为分析和AI工作负载提供更快搜索速度。S3表格专门存储结构化数据如交易记录,向量搜索API处理非结构化数据的数学表示,两者结合为存储在ObjectScale上的复杂数据提供高速访问。
好文章,需要你的鼓励
企业AI搜索公司Glean宣布年度经常性收入(ARR)达3亿美元,较15个月前的1亿美元增长三倍。尽管谷歌、微软、OpenAI等科技巨头纷纷入局企业AI搜索市场,Glean凭借"上下文图谱"技术深度理解企业业务需求,并帮助客户显著降低AI计算成本。该公司提供按用量计费和混合定价两种模式,客户涵盖Databricks、Reddit、Pinterest及三星等企业。Glean上轮融资后估值达72亿美元。
香港中文大学与MiniMax提出ClaimDiff-RL框架,将图像描述的AI训练从整体打分升级为逐条核查,有效解决了传统方式导致AI"少说保平安"的问题,同时在多项基准测试上超越Gemini-3-Pro-Preview。
杰夫·贝索斯旗下的蓝色起源公司在佛罗里达卡纳维拉尔角进行静态点火测试时,新格伦重型火箭发生爆炸。这是美国历史上最大规模的火箭爆炸之一,也是蓝色起源公司遭遇的最严重失败。所有人员安全,但该事故可能导致新格伦火箭项目长期暂停。此前该火箭已成功完成三次发射,并实现了助推器回收和重复使用。
ParaVT是一个由南洋理工等多校联合提出的并行视频工具调用框架,通过让AI同时分析多段视频并引入PARA-GRPO算法解决训练中的格式崩溃与工具跳过问题,在六项长视频理解测试中平均提升约7.9%。