戴尔在超级计算2025大会上宣布,闪电项目已成功让PowerScale实现并行化处理,显著提升了文件读写性能,同时还发布了更多PowerScale和ObjectScale相关消息。
戴尔表示,通过这些以及其他AI工厂相关公告,戴尔与英伟达正在"通过戴尔AI工厂与英伟达的技术进步,为企业AI交付未来"。公司宣布了多项服务器、存储和网络产品增强功能,我们重点关注存储方面的进展。PowerScale是戴尔的横向扩展集群文件系统,搭载OneFS软件,其技术源于戴尔收购的Isilon前身产品。ObjectScale是戴尔的分布式、基于微服务的多节点横向扩展多租户对象存储软件,具有支持S3 API的单一全局命名空间。
在SC25大会上,戴尔宣布了并行PowerScale、PowerScale软件授权、面向PowerScale和ObjectScale的NIXL库KV缓存卸载集成,以及ObjectScale的AI优化搜索功能。
戴尔副董事长兼首席运营官杰夫·克拉克表示:"戴尔AI工厂与英伟达解决了每个企业都面临的问题:如何在不重建基础设施的情况下从AI试点转向生产。我们已经完成了集成工作,因此客户无需自行处理,这意味着他们可以更快部署并自信地扩展规模。"
PowerScale技术升级
PowerScale的闪电项目是一个近18个月的开发计划,旨在为PowerScale的OneFS操作系统添加并行IO功能。正如预期的那样,该项目通过使用pNFS(并行NFS)实现,为其数据服务器节点添加了元数据服务器和Flex Files布局支持。
戴尔表示,并行PowerScale在元数据服务器和客户端之间实现了双向通信,允许在PowerScale集群中的多个节点间更好地并行分布数据。这提供了吞吐量、性能提升以及通过集群中多个路径进行并行I/O的线性可扩展性。
PowerScale现在支持NIXL(英伟达推理传输库);这是英伟达的代码,用于加速AI推理框架中的点对点通信,如Dynamo(其低延迟KV缓存卸载引擎),并提供GPU和CPU内存以及文件、块和对象存储的抽象,具有模块化插件架构。PowerScale的NIXL支持实现了可扩展的KV缓存卸载。在131,000个Token的完整上下文窗口下,它实现了1秒的首Token时间(TTFT),比标准vLLM快19倍。
包括戴尔在内的许多存储供应商都表示支持Dynamo,如Cloudian、Cohesity DDN、日立Vantara、HPE、IBM、NetApp、PEAK:AIO、Pure Storage、VAST Data和WEKA。
PowerScale现在以仅软件、订阅许可的形式提供,可在合格的PowerEdge服务器(如戴尔PowerEdge R7725xd)上运行。这将帮助客户将PowerScale计算设施与PowerScale硬件+软件设备分开购买。
ObjectScale功能增强
两项AI优化搜索功能是S3表格和向量搜索API,旨在为分析和关键AI工作负载(如推理和检索增强生成RAG)提供更快的搜索速度。S3表格存储结构化数据,而向量是非结构化数据的数学表示。两者结合为直接存储在ObjectScale上的复杂数据提供高速访问。
亚马逊表示,"S3表格专门用于存储表格数据,如日常购买交易、流式传感器数据或广告展示。表格数据以列和行的形式表示数据,就像数据库表一样。"有多种方式可以将关系数据库中的数据导入S3表格。例如,可以使用AWS Glue或EMR与Spark作业定期移动数据。
产品可用性
戴尔ObjectScale和搭载英伟达Dynamo的PowerScale现已全球发布。软件定义的PowerScale将在2026年上半年全球发布。戴尔PowerScale并行NFS支持将在2026年全球发布。
技术背景
PowerScale目前运行OneFS操作系统,将文件系统、卷管理器和数据保护结合到在OneFS驱动的存储集群上运行的单一分布式软件层中。集群具有内部或后端网络,包括10Gb、40Gb或100Gb以太网,或低延迟QDR Infiniband(IB)。
客户端使用在所有节点上可用的以太网连接(10GbE、25GbE、40GbE或100GbE)连接到集群。此外,OneFS 9.10及更高版本在全闪存F910和F710平台上支持200GbE前端连接或HDR Infiniband加100Gb以太网。
单个集群由多个节点组成,最少4个,最多252个,这些节点是机架式企业设备,包含:内存、CPU、网络、以太网或低延迟Infiniband互连、磁盘控制器和存储介质。因此,分布式集群中的每个节点都具有计算和存储或容量能力。
平台节点分为三种类型:性能型、混合/实用型和归档型。
OneFS对带有Flex Files的pNFS的支持要求OneFS采用独立的元数据服务器(MDS)软件实体,与数据服务节点实体分离。
Q&A
Q1:戴尔PowerScale闪电项目是什么?它有什么作用?
A:闪电项目是戴尔为期近18个月的开发计划,旨在为PowerScale的OneFS操作系统添加并行IO功能。通过使用pNFS技术和元数据服务器,实现了数据在集群多个节点间的并行分布,显著提升了吞吐量和性能。
Q2:NIXL库对PowerScale有什么影响?
A:NIXL是英伟达推理传输库,PowerScale支持NIXL后可以实现可扩展的KV缓存卸载。在131,000个Token的完整上下文窗口下,能够实现1秒的首Token时间,比标准vLLM快19倍,大幅提升AI推理性能。
Q3:ObjectScale的S3表格和向量搜索API有什么用途?
A:这两项AI优化搜索功能旨在为分析和AI工作负载提供更快搜索速度。S3表格专门存储结构化数据如交易记录,向量搜索API处理非结构化数据的数学表示,两者结合为存储在ObjectScale上的复杂数据提供高速访问。
好文章,需要你的鼓励
研究显示47%的企业在IT人才招聘和留存方面面临挑战,流失率居高不下。意大利53%的IT主管表示人才吸引和保留是日常难题。专家认为人才并非稀缺,而是未得到重视,因此更愿意出国发展。成功的CIO需要识别人才、给予适当机会并建立信任关系。通过持续培训、职业发展机会和有效领导力,企业可以更好地留住IT专业人员。
牛津大学研究团队发现,经过强化学习训练的AI搜索助手存在严重安全漏洞。通过简单的"搜索攻击"(强制AI先搜索)和"多重搜索攻击"(连续十次搜索),可让AI的拒绝率下降60%,安全性降低超过80%。问题根源在于AI的安全训练与搜索功能训练分离,导致搜索时会生成有害查询。研究呼吁开发安全感知的强化学习方法。
一家医疗机构的关键业务应用在早晨高峰期会停止响应长达半小时。技术顾问调查发现,应用厂商在未告知客户的情况下,于业务时间在生产系统上运行修复任务,导致数据库锁定。更令人震惊的是,该生产数据库存储医疗数据和支付信息,却完全没有访问控制,任何用户都可以访问任何数据。
斯坦福大学团队开发了GuideFlow3D技术,通过创新的引导机制解决3D对象外观转换难题。该方法采用智能分割和双重损失函数,能在保持原始几何形状的同时实现高质量外观转换,在多项评估中显著优于现有方法,为游戏开发、AR应用等领域提供了强大工具。