Seagate 正在通过推出采用 HAMR 技术的 36TB Exos M 硬盘样品,扩大其相对于东芝和西部数据的容量领先优势,这也是目前业界容量最大的硬盘。
上个月,该公司宣布已获得一家顶级云服务提供商 (CSP) 的认证许可,可以开始量产和出货采用 HAMR 技术的 32TB Exos M 叠瓦式磁记录 (SMR) 硬盘,现在又将 HAMR 容量提升了 4TB。HAMR Mozaic 3+ 技术通过激光瞬间加热磁盘记录介质涂层上的比特区域,使其磁极性可以被驱动器的写入磁头设定,当冷却至室温后,比特设置将保持稳定。
CEO Dave Mosley 表示:"我们正处于数据存储和管理方式发生重大转变的时期。由于云计算的持续扩张和早期 AI 的采用,前所未有的数据创建量要求长期的数据保留和访问,以确保可信的数据驱动成果...Seagate 继续在面密度方面保持领先,目前在 Exos M 平台上推出容量高达 36TB 的硬盘样品。此外,我们正在执行创新路线图,现已在测试环境中成功展示了单盘超过 6TB 的容量。"
Dell 的产品管理高级副总裁 Travis Vigil 补充道:"搭载 Seagate HAMR 驱动的 Mozaic 3+ 技术的 Dell PowerScale 在支持检索增强生成 (RAG)、推理和代理工作流等 AI 应用场景中发挥着关键作用。Dell Technologies 和 Seagate 正共同制定行业领先的 AI 存储创新标准。"
竞争对手东芝和西部数据使用微波辅助磁记录 (MAMR) 的变体技术来存储数据,但其记录介质无法支持像 HAMR 那样小的比特区域。这意味着他们的磁盘盘片面密度低于 Seagate 的 HAMR 硬盘,后者采用十盘设计,单盘容量现已达到 3.6TB。相比之下,西部数据最高容量为 32TB,采用十一盘设计,单盘面密度为 2.91TB,比 Seagate 低 19%。
东芝的 MA11 系列 SMR 最大容量为 28TB,采用十盘设计,单盘容量为 2.8TB,面密度低于西部数据,比 Seagate 低 22.2%。
西部数据和东芝都表示将转向 HAMR 技术。2022 年,东芝表示其路线图中包括在 2026 财年或更晚推出 40TB+ 的 HAMR 硬盘。Seagate 计划在今年下半年推出第二代 40TB HAMR 硬盘。考虑到东芝客户需要对其 HAMR 硬盘进行认证,而 Seagate 发现要实现可接受的生产良率和可靠性是一个多年的过程,东芝可能要到 2027 年才能开始大规模供货 HAMR 硬盘,比 Seagate 晚两年。
西部数据也有引入 HAMR 技术的计划。根据 CFO Wissam Jabre 在 2023 年 6 月的说法,需要 12 到 18 个月的时间。现在已经过去了 18 个月,但 WD 的 HAMR 技术尚未面世。巧合的是,Jabre 刚刚辞职。
与东芝一样,西部数据会发现 HAMR 硬盘需要较长的制造开发时间,同时也需要客户认证,特别是对可靠性要求较高的云服务提供商和超大规模数据中心运营商,他们将是这些 7200 转近线硬盘的最大客户。当西部数据转向 HAMR 时,可能会比 Seagate 落后 12 个月或更长时间。
Exos M 36TB 硬盘采用 6Gbps SATA 接口。Seagate 尚未公布其持续传输率、缓存大小、MTBF 等详细参数。我们预计这些信息将在几周内公布,并且与其现有的 Exos MA11 32TB 硬盘相近,这将使 Seagate 在容量方面保持至少 12 个月的优势。
好文章,需要你的鼓励
这篇研究论文介绍了"Speechless",一种创新方法,可以在不使用实际语音数据的情况下训练语音指令模型,特别适用于越南语等低资源语言。研究团队通过将文本指令转换为语义表示,绕过了对高质量文本转语音(TTS)系统的依赖。该方法分三个阶段:首先训练量化器将语音转为语义标记;然后训练Speechless模型将文本转为这些标记;最后用生成的合成数据微调大型语言模型。实验表明,该方法在越南语ASR任务中表现出色,为低资源语言的语音助手开发提供了经济高效的解决方案。
《Transformer Copilot》论文提出了一种革命性的大语言模型微调框架,通过系统记录和利用模型训练过程中的"错误日志"来提升推理性能。研究团队受人类学习者记录和反思错误的启发,设计了一个"副驾驶"模型来辅助原始"驾驶员"模型,通过学习错误模式并在推理时校正输出。这一方法在12个基准测试上使模型性能提升高达34.5%,同时保持计算开销最小,展现了强大的可扩展性和可迁移性,为大语言模型的优化提供了全新思路。
德克萨斯大学Austin分校的研究团队提出了RIPT-VLA,一种创新的视觉-语言-动作模型后训练范式。该方法通过让AI模型与环境互动并仅接收简单的成功/失败反馈来学习,无需复杂的奖励函数或价值模型。实验证明,RIPT-VLA能显著提升现有模型性能,在轻量级QueST模型上平均提升21.2%,将大型OpenVLA-OFT模型推至97.5%的前所未有成功率。最令人惊叹的是,仅用一个示范样本,它就能将几乎不可用的模型在15次迭代内从4%提升至97%的成功率,展现出卓越的数据效率和适应能力。
北京大学与华为诺亚方舟实验室研究团队共同开发了TIME基准,这是首个专为评估大语言模型在真实世界场景中的时间推理能力而设计的多层级基准。该研究提出了三个层级的时间推理框架,包含11个细粒度任务,并构建了涵盖38,522个问答对的数据集,针对知识密集型信息、快速变化的事件动态和社交互动中的复杂时间依赖性三大现实挑战。实验结果表明,即使是先进模型在构建时间线和理解复杂时间关系方面仍面临显著挑战,而测试时扩展技术可明显提升时间逻辑推理能力。