采访:开放闪存平台(OFP)组织旨在用直接访问的闪存卡槽取代全闪存阵列,这些卡槽配备控制器DPU、Linux和并行NFS(pNFS)软件,以及网络连接。这一概要昨天已经公布。我们现在从OFP获得了更多细节和背景说明。
Hammerspace实际上正在主导这一倡议,全球营销负责人Molly Presley向我们介绍了导致OFP组织成立的背景。"随着数据中心设计的演进,特别是在新云、超大规模和大型AI公司中,出现了几个遗留架构无法适应的基础设施限制。AI架构迫切需要专注于电源效率、可扩展性和设计简单性的存储系统,以释放GPU的功耗,扩展到数据容量需求,并快速部署。
"OFP倡议希望看到一个新的解决方案,为存储数据提供最可扩展、最密集的系统,既节能又具有成本效益。随着AI驱动需求从PB规模向EB规模转移,需要比当前基于遗留构建块定义的系统更高效、更可扩展的架构。
"当前默认的共享存储架构和平台在扩展和密度方面存在局限性,使其不适合面临大规模数据增长以支持AI应用的环境需求。客户目前使用的是运行专有存储软件的高功耗服务器,通常由基于磁盘驱动器外形规格而非为闪存密度优化设计的机箱支持。
"当前一代IPU/DPU使这种新的低功耗、高密度外形规格成为可能。通过将它们与闪存优化机箱结合,并利用标准Linux协议在高性能数据服务方面的进步,我们可以提供极其高效的存储解决方案,同时降低成本(即无节点级许可、将服务寿命延长至闪存的八年寿命,而非服务器五年的更新周期,大幅降低功耗、空间和冷却要求)。
"这些单独来看都不是新的,但OFP倡议寻求将卸载引擎、NAND技术和当今可用的Linux功能的进步结合成一个针对紧迫行业需求的设计。这不能通过另一个专有孤岛来实现,因此更广泛的行业参与和采用将是该倡议的基本目标。"
我们向该组织提出了一系列问题,Presley回复了答案。
Blocks & Files:OFP如何获得资金?
OFP:Hammerspace已资助初步工程研究,以探索工作POC/参考设计的选择。ScaleFlux和另外两家SSD供应商(我们尚未获得企业批准在OFP倡议中引用)提供了SSD。Xsight和其他IPU/DPU供应商(我们尚未获得企业批准在OFP倡议中引用)为项目提供了开发板。SK海力士和LANL一直在演示利用本机Linux存储和NFS功能的pNFS能力。总之,倡议成员都在为项目贡献技术和专业知识。
Blocks & Files:OFP如何治理?
OFP:我们正在积极招募合作伙伴,但除了参与者之间的初步工程级合作外,尚未考虑更广泛的治理规则。我们对未来可能参与的现有治理机构有一些概念,并正在为他们准备一些提案。但这些是未来的讨论。
Blocks & Files:OFP成员资格有哪些类别?
OFP:参与分为两类:1)技术提供商;2)最终用户顾问。OFP概念也已与数十个大规模最终用户进行了交流。他们的意见正在被纳入设计考虑中。
Blocks & Files:谁在物理外形规格、软件接口、网络接口、DPU外形规格和接口、电源接口和功率等方面定义OFP卡槽规格?
OFP:最初,Hammerspace已为托盘、卡槽、电气接口、软件、热管理等开发了建议的参考规格。我们正在积极寻求不仅来自倡议成员,还有潜在客户的反馈。其他实施方案也将受到欢迎。
Blocks & Files:OFP卡槽规格是否存在?
OFP:我们有一个初步规格,允许标准和新外形规格的SSD驻留在卡槽中,并正在与倡议合作伙伴组内征求反馈,然后公开发布任何信息。我们预计在2025年下半年进一步公布有关罐体和托盘设计的信息,包括年底前的工作原型公开演示。
Blocks & Files:如何验证OFP卡槽产品规格合规性?
OFP:待定。
Blocks & Files:谁定义OFP托盘规格?
OFP:与上述相同。最初。
Blocks & Files:OFP托盘规格是否存在?
OFP:是的,见上文。
Blocks & Files:OFP托盘规格支持哪些数据中心机架设计?
OFP:第一个参考设计将是EIA 19英寸机架,但我们也有OCP 21英寸机架设计的计划。
Blocks & Files:哪些供应商制造OFP托盘?
OFP:最初只有合同制造商,但与OEM和系统集成商的讨论正在进行中。
Blocks & Files:如何验证OFP托盘产品规格合规性?
OFP:待定。
Blocks & Files:OFP与开放计算项目(OCP)有何关系?
OFP:我们已经在与Meta合作,最终希望将这个OFP倡议纳入OCP。这是最终目标。
我们看到了相当大的行业兴趣,更多合作伙伴加入设计需求的讨论,以及可能的新成员在未来几周加入公共努力。我们也有大量早期客户兴趣。随着倡议成熟度的提高,发布相关信息对于未来几年正在规划的数据中心设计和基础设施战略极其重要。正如您所知,AI方面的大规模投资正在进行中。对新兴架构的可见性在行业以如此飞快速度发展的情况下非常有价值。
好文章,需要你的鼓励
Dfinity基金会发布Caffeine AI平台,通过自然语言提示创建功能完整的应用程序,旨在将全球开发者数量从5000万扩展到50亿。该平台基于区块链技术,用户可通过对话方式快速构建应用,包括博客和电商网站等。与Anthropic合作提供后端支持,挑战传统应用商店模式。
微软研究院推出SambaY架构,通过创新的门控记忆单元实现AI推理速度10倍提升。该技术采用解码器-混合-解码器设计,在数学推理等复杂任务上表现卓越,为高效AI推理开辟新方向,有望推动AI在教育、科研、医疗等领域的广泛应用。
社交媒体巨头Meta开发了一个AI模型来创造新型混凝土配方,并将其中一种应用于新数据中心的地面浇筑。该模型采用贝叶斯优化技术预测不同混凝土配比的抗压强度曲线,显著加速了传统需要数天或数周的测试过程。Meta与建筑公司Amrize和伊利诺伊大学合作,在明尼苏达州罗斯蒙特数据中心使用了这种新型低碳混凝土。该设施初期功率为10兆瓦,未来将扩展至75兆瓦。
瑞士EPFL研究团队开发的PERK方法通过参数高效的测试时学习技术,让AI能够像人类一样将长文档信息编码到专门的记忆模块中,显著提升了长上下文推理能力。该方法在多项测试中表现卓越,不仅能处理比训练时长32倍的文档,还解决了传统AI的位置偏见问题,为处理复杂长文档提供了创新解决方案。