戴尔正在打造一款超级增压版生成式AI数据存储产品,即具备智能横向扩展、OneFS增强功能与持续对齐PowerScale SuperPOD验证的第二代全闪存PowerScale。
其目的也非常明确:让PowerScale成为适用于一般AI与生成式AI工作负载的存储优化型产品。
戴尔基础设施解决方案部门负责人Arthur Lewis表示,“存储性能是成功实现AI与生成式AI成果的关键因素”,并补充称客户希望戴尔消除“限制计算密集型应用程序的吞吐量/可扩展性等数据访问瓶颈。我们也在积极提供快速、高效且安全的数据访问技术,将PowerScale转化为具有广泛市场认可度的AI与生成式AI配套解决方案。”
戴尔公司宣称,基于最新一代PowerEdge服务器打造的新款PowerScale全闪存存储系统,将把流式读取与写入性能提升达2倍。
PowerScale将拥有新的智能横向扩展功能,有助于提高单个计算节点性能,从而改善GPU利用率,并为AI训练、检查点与推理等负载提供更高的存储吞吐量。
即将推出的OneFS软件增强功能则让客户可以加快AI模型的准备、训练、微调和推理速度。
戴尔目前正使用英伟达的DGX SuperPOD对PowerScale进行验证,预计它将成为该平台上通过验证的首个以太网存储系统。
该公司表示,其面向微软Azure的戴尔APEX for File Storage将在Azure当中提供企业级文件性能与管理功能,充分满足性能密集型AI与机器学习应用(例如Azure OpenAI Service和Azure AI Vision)的实际需求。
与Databricks之间的合作,则允许客户随意选择各种大语言模型(LLM),并使用Databricks MosaicML中的库配合由戴尔APEX for File Storage提供的专有数据重新训练基础模型。作为跨多云环境的灵活选项,戴尔在AWS环境下同样提供APEX文件存储功能。
18机架SuperPOD
戴尔表示,经过SuperPOD验证的PowerScale意味着客户可以通过英伟达Quantum-2 InfiniBand和Spectrum以太网网络将数据传入/传出SuperPOD GPU设施。由此看来,新一代PowerScale将与强调支持SUperPOD的VAST Data和DDN构成竞争关系。
目前关于新一代PowerScale全闪存系统、OneFS增强功能和智能横向扩展的细节信息尚未披露,我们已向戴尔申请进一步说明。
PowerScale OneFS软件增强功能将于本月全球上市。
下一代全闪存PowerScale系统及智能横向扩展功能将于2024年上半年全球发布,适用于微软Azure的戴尔APEX for File Storage也将登陆全球市场。PowerScale的英伟达DGX SuperPOD验证工作预计将在2024年第一季度完成。
集成Databricks/MosaicML的戴尔APEX for File Storage现已在AWS上发布,并将于2024年上半年登陆微软Azure。戴尔的开放式现代数据智能湖仓产品计划于2024年上半年在全球范围内推出。
好文章,需要你的鼓励
这项来自麻省理工和滑铁卢大学的研究质疑了在AI文本排序中"思考过程"的必要性。研究者比较了三种文章重排模型:直接判断的StandardRR、先推理再判断的ReasonRR,以及禁用推理功能的ReasonRR-NoReason。实验结果表明,不仅推理过程没有提高排序质量,有时甚至会降低效果。主要原因是推理导致模型倾向于极端判断,难以表达"部分相关"这种微妙关系。即使应用"自洽性"等改进技术,简单直接的判断方式仍然更为高效有效。研究为信息检索系统设计提供了新视角:有时,少即是多。
TAGS是一种创新的医学问答框架,结合了泛医和专医两种视角,通过层次化检索和不确定性验证机制提升医学AI回答的准确性。该框架由穆罕默德·本·扎耶德人工智能大学等机构的研究团队开发,无需任何模型微调即可显著提升包括GPT-4o和DeepSeek-R1在内的大型语言模型在九个医学问答基准测试上的表现。TAGS通过模拟医疗专家协作、结构化知识检索和质量控制,解决了现有方法在复杂医学推理中的短板,为构建更可靠的医学AI系统提供了新思路。
这篇研究提出了时间抽象值学习(OTA)方法,解决离线目标条件强化学习中的长期规划问题。研究团队发现现有分层方法失败的关键在于高层策略无法生成合适子目标,原因是价值函数在长期规划中估计不准确。OTA通过"选项"概念实现时间抽象,有效缩短规划视野,使价值函数能提供更准确的优势信号。在复杂迷宫导航和视觉机器人操作任务中,OTA显著优于现有方法,证明了该方法在处理长期任务时的有效性。
这项研究探索了大语言模型内部可解释特征的形成过程,分析了它们在训练过程中(时间)、模型层级间(空间)和不同规模模型(尺度)的行为变化。研究团队使用稀疏自编码器技术,成功识别出特定语义概念在神经激活中出现的时间点和位置。研究结果显示,不同领域的知识概念在模型训练和规模扩展中存在明确的激活阈值,且在空间分析中发现了早期层特征会在后期层重新激活的现象,这挑战了对变换器模型表示动态的传统认知。