戴尔在超级计算2025大会上宣布,闪电项目已成功让PowerScale实现并行化处理,显著提升了文件读写性能,同时还发布了更多PowerScale和ObjectScale相关消息。
戴尔表示,通过这些以及其他AI工厂相关公告,戴尔与英伟达正在"通过戴尔AI工厂与英伟达的技术进步,为企业AI交付未来"。公司宣布了多项服务器、存储和网络产品增强功能,我们重点关注存储方面的进展。PowerScale是戴尔的横向扩展集群文件系统,搭载OneFS软件,其技术源于戴尔收购的Isilon前身产品。ObjectScale是戴尔的分布式、基于微服务的多节点横向扩展多租户对象存储软件,具有支持S3 API的单一全局命名空间。
在SC25大会上,戴尔宣布了并行PowerScale、PowerScale软件授权、面向PowerScale和ObjectScale的NIXL库KV缓存卸载集成,以及ObjectScale的AI优化搜索功能。
戴尔副董事长兼首席运营官杰夫·克拉克表示:"戴尔AI工厂与英伟达解决了每个企业都面临的问题:如何在不重建基础设施的情况下从AI试点转向生产。我们已经完成了集成工作,因此客户无需自行处理,这意味着他们可以更快部署并自信地扩展规模。"
PowerScale技术升级
PowerScale的闪电项目是一个近18个月的开发计划,旨在为PowerScale的OneFS操作系统添加并行IO功能。正如预期的那样,该项目通过使用pNFS(并行NFS)实现,为其数据服务器节点添加了元数据服务器和Flex Files布局支持。
戴尔表示,并行PowerScale在元数据服务器和客户端之间实现了双向通信,允许在PowerScale集群中的多个节点间更好地并行分布数据。这提供了吞吐量、性能提升以及通过集群中多个路径进行并行I/O的线性可扩展性。
PowerScale现在支持NIXL(英伟达推理传输库);这是英伟达的代码,用于加速AI推理框架中的点对点通信,如Dynamo(其低延迟KV缓存卸载引擎),并提供GPU和CPU内存以及文件、块和对象存储的抽象,具有模块化插件架构。PowerScale的NIXL支持实现了可扩展的KV缓存卸载。在131,000个Token的完整上下文窗口下,它实现了1秒的首Token时间(TTFT),比标准vLLM快19倍。
包括戴尔在内的许多存储供应商都表示支持Dynamo,如Cloudian、Cohesity DDN、日立Vantara、HPE、IBM、NetApp、PEAK:AIO、Pure Storage、VAST Data和WEKA。
PowerScale现在以仅软件、订阅许可的形式提供,可在合格的PowerEdge服务器(如戴尔PowerEdge R7725xd)上运行。这将帮助客户将PowerScale计算设施与PowerScale硬件+软件设备分开购买。
ObjectScale功能增强
两项AI优化搜索功能是S3表格和向量搜索API,旨在为分析和关键AI工作负载(如推理和检索增强生成RAG)提供更快的搜索速度。S3表格存储结构化数据,而向量是非结构化数据的数学表示。两者结合为直接存储在ObjectScale上的复杂数据提供高速访问。
亚马逊表示,"S3表格专门用于存储表格数据,如日常购买交易、流式传感器数据或广告展示。表格数据以列和行的形式表示数据,就像数据库表一样。"有多种方式可以将关系数据库中的数据导入S3表格。例如,可以使用AWS Glue或EMR与Spark作业定期移动数据。
产品可用性
戴尔ObjectScale和搭载英伟达Dynamo的PowerScale现已全球发布。软件定义的PowerScale将在2026年上半年全球发布。戴尔PowerScale并行NFS支持将在2026年全球发布。
技术背景
PowerScale目前运行OneFS操作系统,将文件系统、卷管理器和数据保护结合到在OneFS驱动的存储集群上运行的单一分布式软件层中。集群具有内部或后端网络,包括10Gb、40Gb或100Gb以太网,或低延迟QDR Infiniband(IB)。
客户端使用在所有节点上可用的以太网连接(10GbE、25GbE、40GbE或100GbE)连接到集群。此外,OneFS 9.10及更高版本在全闪存F910和F710平台上支持200GbE前端连接或HDR Infiniband加100Gb以太网。
单个集群由多个节点组成,最少4个,最多252个,这些节点是机架式企业设备,包含:内存、CPU、网络、以太网或低延迟Infiniband互连、磁盘控制器和存储介质。因此,分布式集群中的每个节点都具有计算和存储或容量能力。
平台节点分为三种类型:性能型、混合/实用型和归档型。
OneFS对带有Flex Files的pNFS的支持要求OneFS采用独立的元数据服务器(MDS)软件实体,与数据服务节点实体分离。
Q&A
Q1:戴尔PowerScale闪电项目是什么?它有什么作用?
A:闪电项目是戴尔为期近18个月的开发计划,旨在为PowerScale的OneFS操作系统添加并行IO功能。通过使用pNFS技术和元数据服务器,实现了数据在集群多个节点间的并行分布,显著提升了吞吐量和性能。
Q2:NIXL库对PowerScale有什么影响?
A:NIXL是英伟达推理传输库,PowerScale支持NIXL后可以实现可扩展的KV缓存卸载。在131,000个Token的完整上下文窗口下,能够实现1秒的首Token时间,比标准vLLM快19倍,大幅提升AI推理性能。
Q3:ObjectScale的S3表格和向量搜索API有什么用途?
A:这两项AI优化搜索功能旨在为分析和AI工作负载提供更快搜索速度。S3表格专门存储结构化数据如交易记录,向量搜索API处理非结构化数据的数学表示,两者结合为存储在ObjectScale上的复杂数据提供高速访问。
好文章,需要你的鼓励
两家公司在OverdriveAI峰会上分享了AI应用经验。Verizon拥有超过1000个AI模型,用于预测客户呼叫原因和提供个性化服务,将AI推向边缘计算。Collectors则利用AI识别收藏品真伪,将每张卡片的鉴定时间从7分钟缩短至7秒,估值从8.5亿美元增长至43亿美元。
阿布扎比科技创新研究院团队首次发现大语言模型生成的JavaScript代码具有独特"指纹"特征,开发出能够准确识别代码AI来源的系统。研究创建了包含25万代码样本的大规模数据集,涵盖20个不同AI模型,识别准确率在5类任务中达到95.8%,即使代码经过混淆处理仍保持85%以上准确率,为网络安全、教育评估和软件取证提供重要技术支持。
Hammerspace发布v5.2数据平台软件,通过更快的元数据读取、更好的数据放置和扩展性优化提升AI数据访问性能。新版本IO500总分提升33.7%,总带宽翻倍,IOR-Hard-Read测试提升超800%。增加了Tier 0亲和性功能,支持GPU服务器本地存储访问,减少集群内网络流量。新增Oracle云支持、Kerberos认证和标签化NFS,提供更细粒度的访问控制。该软件将于12月正式发布。
斯坦福大学研究团队首次系统比较了人类与AI在文本理解任务中的表现。通过HUME评估框架测试16个任务发现:人类平均77.6%,最佳AI为80.1%,排名第4。人类在非英语文化理解任务中显著优于AI,而AI在信息处理任务中更出色。研究揭示了当前AI评估体系的缺陷,指出AI的高分往往出现在任务标准模糊的情况下。