戴尔在超级计算2025大会上宣布,闪电项目已成功让PowerScale实现并行化处理,显著提升了文件读写性能,同时还发布了更多PowerScale和ObjectScale相关消息。
戴尔表示,通过这些以及其他AI工厂相关公告,戴尔与英伟达正在"通过戴尔AI工厂与英伟达的技术进步,为企业AI交付未来"。公司宣布了多项服务器、存储和网络产品增强功能,我们重点关注存储方面的进展。PowerScale是戴尔的横向扩展集群文件系统,搭载OneFS软件,其技术源于戴尔收购的Isilon前身产品。ObjectScale是戴尔的分布式、基于微服务的多节点横向扩展多租户对象存储软件,具有支持S3 API的单一全局命名空间。
在SC25大会上,戴尔宣布了并行PowerScale、PowerScale软件授权、面向PowerScale和ObjectScale的NIXL库KV缓存卸载集成,以及ObjectScale的AI优化搜索功能。
戴尔副董事长兼首席运营官杰夫·克拉克表示:"戴尔AI工厂与英伟达解决了每个企业都面临的问题:如何在不重建基础设施的情况下从AI试点转向生产。我们已经完成了集成工作,因此客户无需自行处理,这意味着他们可以更快部署并自信地扩展规模。"
PowerScale技术升级
PowerScale的闪电项目是一个近18个月的开发计划,旨在为PowerScale的OneFS操作系统添加并行IO功能。正如预期的那样,该项目通过使用pNFS(并行NFS)实现,为其数据服务器节点添加了元数据服务器和Flex Files布局支持。
戴尔表示,并行PowerScale在元数据服务器和客户端之间实现了双向通信,允许在PowerScale集群中的多个节点间更好地并行分布数据。这提供了吞吐量、性能提升以及通过集群中多个路径进行并行I/O的线性可扩展性。
PowerScale现在支持NIXL(英伟达推理传输库);这是英伟达的代码,用于加速AI推理框架中的点对点通信,如Dynamo(其低延迟KV缓存卸载引擎),并提供GPU和CPU内存以及文件、块和对象存储的抽象,具有模块化插件架构。PowerScale的NIXL支持实现了可扩展的KV缓存卸载。在131,000个Token的完整上下文窗口下,它实现了1秒的首Token时间(TTFT),比标准vLLM快19倍。
包括戴尔在内的许多存储供应商都表示支持Dynamo,如Cloudian、Cohesity DDN、日立Vantara、HPE、IBM、NetApp、PEAK:AIO、Pure Storage、VAST Data和WEKA。
PowerScale现在以仅软件、订阅许可的形式提供,可在合格的PowerEdge服务器(如戴尔PowerEdge R7725xd)上运行。这将帮助客户将PowerScale计算设施与PowerScale硬件+软件设备分开购买。
ObjectScale功能增强
两项AI优化搜索功能是S3表格和向量搜索API,旨在为分析和关键AI工作负载(如推理和检索增强生成RAG)提供更快的搜索速度。S3表格存储结构化数据,而向量是非结构化数据的数学表示。两者结合为直接存储在ObjectScale上的复杂数据提供高速访问。
亚马逊表示,"S3表格专门用于存储表格数据,如日常购买交易、流式传感器数据或广告展示。表格数据以列和行的形式表示数据,就像数据库表一样。"有多种方式可以将关系数据库中的数据导入S3表格。例如,可以使用AWS Glue或EMR与Spark作业定期移动数据。
产品可用性
戴尔ObjectScale和搭载英伟达Dynamo的PowerScale现已全球发布。软件定义的PowerScale将在2026年上半年全球发布。戴尔PowerScale并行NFS支持将在2026年全球发布。
技术背景
PowerScale目前运行OneFS操作系统,将文件系统、卷管理器和数据保护结合到在OneFS驱动的存储集群上运行的单一分布式软件层中。集群具有内部或后端网络,包括10Gb、40Gb或100Gb以太网,或低延迟QDR Infiniband(IB)。
客户端使用在所有节点上可用的以太网连接(10GbE、25GbE、40GbE或100GbE)连接到集群。此外,OneFS 9.10及更高版本在全闪存F910和F710平台上支持200GbE前端连接或HDR Infiniband加100Gb以太网。
单个集群由多个节点组成,最少4个,最多252个,这些节点是机架式企业设备,包含:内存、CPU、网络、以太网或低延迟Infiniband互连、磁盘控制器和存储介质。因此,分布式集群中的每个节点都具有计算和存储或容量能力。
平台节点分为三种类型:性能型、混合/实用型和归档型。
OneFS对带有Flex Files的pNFS的支持要求OneFS采用独立的元数据服务器(MDS)软件实体,与数据服务节点实体分离。
Q&A
Q1:戴尔PowerScale闪电项目是什么?它有什么作用?
A:闪电项目是戴尔为期近18个月的开发计划,旨在为PowerScale的OneFS操作系统添加并行IO功能。通过使用pNFS技术和元数据服务器,实现了数据在集群多个节点间的并行分布,显著提升了吞吐量和性能。
Q2:NIXL库对PowerScale有什么影响?
A:NIXL是英伟达推理传输库,PowerScale支持NIXL后可以实现可扩展的KV缓存卸载。在131,000个Token的完整上下文窗口下,能够实现1秒的首Token时间,比标准vLLM快19倍,大幅提升AI推理性能。
Q3:ObjectScale的S3表格和向量搜索API有什么用途?
A:这两项AI优化搜索功能旨在为分析和AI工作负载提供更快搜索速度。S3表格专门存储结构化数据如交易记录,向量搜索API处理非结构化数据的数学表示,两者结合为存储在ObjectScale上的复杂数据提供高速访问。
好文章,需要你的鼓励
AI颠覆预计将在2026年持续,推动企业适应不断演进的技术并扩大规模。国际奥委会、Moderna和Sportradar的领导者在纽约路透社峰会上分享了他们的AI策略。讨论焦点包括自建AI与购买第三方资源的选择,AI在内部流程优化和外部产品开发中的应用,以及小型模型在日常应用中的潜力。专家建议,企业应将AI建设融入企业文化,以创新而非成本节约为驱动力。
字节跳动等机构联合发布GAR技术,让AI能同时理解图像的全局和局部信息,实现对多个区域间复杂关系的准确分析。该技术通过RoI对齐特征重放方法,在保持全局视野的同时提取精确细节,在多项测试中表现出色,甚至在某些指标上超越了体积更大的模型,为AI视觉理解能力带来重要突破。
Spotify在新西兰测试推出AI提示播放列表功能,用户可通过文字描述需求让AI根据指令和听歌历史生成个性化播放列表。该功能允许用户设置定期刷新,相当于创建可控制算法的每周发现播放列表。这是Spotify赋予用户更多控制权努力的一部分,此前其AI DJ功能也增加了语音提示选项,反映了各平台让用户更好控制算法推荐的趋势。
Inclusion AI团队推出首个开源万亿参数思维模型Ring-1T,通过IcePop、C3PO++和ASystem三项核心技术突破,解决了超大规模强化学习训练的稳定性和效率难题。该模型在AIME-2025获得93.4分,IMO-2025达到银牌水平,CodeForces获得2088分,展现出卓越的数学推理和编程能力,为AI推理能力发展树立了新的里程碑。