20年前谈数据存储,谈的是银行的计费、存钱、取钱等核心应用的数据存储,今天在AI时代、大数据时代,基于数据的存储、管理、优化,又带来了新的命题。
“除了我们常提的块数据、文件数据、对象数据,越来越多的数据是机器生成的,甚至是机器根据机器生成的数据进行再加工,就像生成式AI一样所生成的数据,如何存储和管理这些数据,帮助他们在用这些数据的时候做人工智能和大数据分析的过程中更顺畅发掘更多的价值,这就是戴尔科技存储的使命。“戴尔科技集团大中华区信息基础架构解决方案事业部存储业务总经理刘志洪近日在戴尔科技软件驱动型存储及UDS新品介绍媒体沟通会谈到。
软件驱动型存储创新成就现代化的存储体验
我们知道,随着新的应用方式层出不穷,存储本身简单易用和互联互通就变得非常重要,因为它可能是涉及到汽车人工智能自动驾驶,到互联网、娱乐设施都要互联互通,最终是数据在不同的平台之间的流动和处理,那怎么样保证它简单易用和互联互通,成为戴尔科技考虑的挑战。
戴尔科技拥有广泛的产品组合,涵盖整个IT堆栈(存储、服务器、软件、网络等),可帮助组织在宏观层面上简化其IT生态系统。同时,凭借其持续现代化的存储系统,助力用户提高工作效率,并从位于各种位置的数据中发掘更好的见解。可帮助组织在宏观层面上简化其IT生态系统。
戴尔科技“持续推进存储现代化”的具体方法通过软件驱动型创新实现,其特点是以自动化、安全性和支持多云环境的能力为中心,用先进的存储技术,助力企业提升IT运营效率,增强网络弹性,让多云更灵活。
“戴尔科技在存储领域拥有超过30年的专业经验,连续多年蝉联IDC全球企业级外部存储第一,拥有大量卓越的存储解决方案产品组合,利用现代化技术,持续领跑全球外部存储市场。”刘志洪谈到。
戴尔科技如何做到持续存储创新?
软件驱动存储创新,指的是随着人们越来越关注 AIOps、DevOps、安全性和多云,创新不再仅仅与存储容量和性能有关。因此,戴尔科技在整个存储产品组合中(包括 PowerStore、PowerMax、PowerFlex、PowerScale、PowerProtect、Unity XT 和 CloudIQ)积极实现软件创新(适应性强的软件体系结构、全面的网络弹性和多云生态系统灵活性等)。助力客户加快速度,用更少的资源完成更多的工作。
“过去一年,戴尔科技存储软件推出2,000多项新功能,跨整个产品组合,涵盖各个主要存储细分市场,从块, 文件和对象存储到超融合软件定义基础架构以及多云数据保护,同时戴尔工程师中85%都是软件工程师,这可能跟很多人想象是不一样的,存储软件创新是戴尔科技非常重要的一部分。”戴尔科技集团大中华区存储产品部总监范圣俭谈到。
持续的软件驱动型创新投入,比如PowerStore就是一个从头开始构建的“软件优先”存储体系结构,可为当今多样化的分布式工作负载环境提供高级存储服务。PowerStore操作系统是基于容器化微服务平台的模块化和敏捷操作系统,通过它能够迅速提供新功能,而不会造成中断。戴尔科技存储的软件体系结构具备集成智能,内置 AI 和自动化,从而与客户一起适应变化。
以UDS构建面向AI的现代化存储底座
戴尔科技的非结构化数据解决方案连续8年获得了Gartner领导者象限的地位,证明了戴尔科技集团在非结构化解决方案领域,在不断地突破、不断的创新,不断地跟随业界最新的热点满足用户不断升高的需求。
过去一年,PowerScale或者是说整个UDS家族中通过AI结合的创新是戴尔科技的优势之一。戴尔科技全面拥抱AI不仅仅是在产品的层面,整个UDS存储系统是非常开放的软件架构。从数据分析工具到AI的流程化软件,以及云的生态,都支持软件生态的合作伙伴。
“因为整个AI目前只是用户整个生产力、产业链中的一环,很多用户把AI的工作负载和数据分析和机器学习、云上、云下的数据都有紧密的结合。在这块我们不仅仅要看AI本身还要看数据管理,看软件工具,看云上云下的数据打通,云上云下的数据如何做结合。” 戴尔科技集团大中华区非结构化数据存储事业部产品经理李海谈到。
并且早在2015年开始,戴尔科技集团就和英伟达密切配合。戴尔科技与英伟达的认证是在整个实验室里通过软件加硬件以及服务做了充分的结合。通过认证以后可以给用户一个完整的、经过验证的解决方案,使得用户可以在最短的时间里,把最新的AI的硬件和软件技术带到现实的场景里面去,而不需要做很多的探索和摸索。
整个戴尔科技集团在底座里最强大的有三个产品,一个叫PowerScale、一个ECS、一个ObjectScale,分别代表着分布式文件定义系统和对象存储以及软件定义的对象和文件存储,这三块都可以满足不同的用户不同工作负载在不同的场景下对AI的需求。
除此之外,戴尔科技除了有不同的产品、不同的平台、不同的声音带给用户以外,还有一整套的方法论和服务,帮助今天没有经验的用户更好地搭建他的AI的平台。
最新的全闪存节点:PowerScale F210和F710
随着F210和F710的推出,PowerScale 实现了更高的性能和效率。F210是可同时满足高性能和小容量要求的最佳平台,而F710则以1RU的尺寸实现了高性能与大容量的平衡。“这两个节点是全系列都支持NVMe的SSD,全系列也都支持QLC的盘。可以看到无论是性能和容量的密度上,都会得到一个巨幅的提升。这就是新发布的两个节点里面的主要的亮点。” 戴尔科技集团大中华区存储产品部产品经理岑广海分享到。
PowerScale新品无可比拟的性能
在软件优化的加持下,流式读取性能相较上一代产品提升高达两倍,显著加快了向GPU馈送数据进行模型训练和微调的速度。同样,流式写入性能提高了一倍,可优化AI 工作流程的模型训练和推理阶段的检查点功能。此外,PowerScale 去年的软件和硬件升级有助于加快周转时间,降低试产延迟的风险,并在高并发和延迟敏感型工作负载,如高频交易(HFT)和电子设计自动化(EDA)中,实现最高2.6 倍的性能提升。
更高的效率
戴尔科技在优化客户总拥有成本方面也取得了重大进展。最新平台采用Smart Flow机箱使气流的流动变得更合理,将适量的空气引导至需要的地方,从而提高能效。得益于这些持续不断的创新,戴尔科技在短短一年之内将每瓦性能提高了 90%。
在上一代节点的容量和密度基础上,F710 在 1U 配置中最多可容纳 10 块硬盘,与 F600 相比,节点密度提高了 25%。同样,通过引入 15TB QLC 硬盘,戴尔科技提高了F210紧凑型配置的存储利用率,容量比 F200 提升了一倍。
可以看到,F210和F710极大地丰富了PowerScale的NVMe全闪存产品阵容,具有GPU Direct以及其他嵌入式功能,例如无中断扩展、多租户功能、支持多协议的通用数据访问、极高安全性以及与公有云的灵活性和无缝互操作性等,正在改变高速存储的游戏规则,并支持要求最苛刻的文件工作负载,如AI和GenAI。
借助这两款最新的PowerScale全闪存节点,戴尔科技将释放数据的力量,快速实现AI创新之旅。
好文章,需要你的鼓励
这项来自麻省理工和滑铁卢大学的研究质疑了在AI文本排序中"思考过程"的必要性。研究者比较了三种文章重排模型:直接判断的StandardRR、先推理再判断的ReasonRR,以及禁用推理功能的ReasonRR-NoReason。实验结果表明,不仅推理过程没有提高排序质量,有时甚至会降低效果。主要原因是推理导致模型倾向于极端判断,难以表达"部分相关"这种微妙关系。即使应用"自洽性"等改进技术,简单直接的判断方式仍然更为高效有效。研究为信息检索系统设计提供了新视角:有时,少即是多。
TAGS是一种创新的医学问答框架,结合了泛医和专医两种视角,通过层次化检索和不确定性验证机制提升医学AI回答的准确性。该框架由穆罕默德·本·扎耶德人工智能大学等机构的研究团队开发,无需任何模型微调即可显著提升包括GPT-4o和DeepSeek-R1在内的大型语言模型在九个医学问答基准测试上的表现。TAGS通过模拟医疗专家协作、结构化知识检索和质量控制,解决了现有方法在复杂医学推理中的短板,为构建更可靠的医学AI系统提供了新思路。
这篇研究提出了时间抽象值学习(OTA)方法,解决离线目标条件强化学习中的长期规划问题。研究团队发现现有分层方法失败的关键在于高层策略无法生成合适子目标,原因是价值函数在长期规划中估计不准确。OTA通过"选项"概念实现时间抽象,有效缩短规划视野,使价值函数能提供更准确的优势信号。在复杂迷宫导航和视觉机器人操作任务中,OTA显著优于现有方法,证明了该方法在处理长期任务时的有效性。
这项研究探索了大语言模型内部可解释特征的形成过程,分析了它们在训练过程中(时间)、模型层级间(空间)和不同规模模型(尺度)的行为变化。研究团队使用稀疏自编码器技术,成功识别出特定语义概念在神经激活中出现的时间点和位置。研究结果显示,不同领域的知识概念在模型训练和规模扩展中存在明确的激活阈值,且在空间分析中发现了早期层特征会在后期层重新激活的现象,这挑战了对变换器模型表示动态的传统认知。