在2019年成功发布20 TB HAMR驱动器的近五年之后,希捷方面终于公布了容量超30 TB的Exos HAMR磁盘驱动器。
为了保障相关产品的可靠性、良品率和制造成本,希捷在复杂的Mozaic 3+技术身上投入了数年的完善和开发周期。现如今,该技术已经正式通过认证并被用于批量生产容纳10张3 TB盘片的新款驱动器。从结果来看,这使得希捷相较其主要竞争对手西部数据的24 TB传统驱动器与28 TB叠瓦式驱动器,获得了约6 TB的存储容量优势。后续,希捷还计划推出35至36 TB级别的叠瓦式HAMR磁盘。此番容量大升级显然是为了更好地适应生成式AI技术的爆发,满足后者对磁盘提出的数据存储需求。同时,AI大模型疯狂吞噬电力的基本特性,也迫使数据中心客户更倾向于选择高容量磁盘以减少运行单位数量,借此节约供电配额。
希捷公司CEO Dave Mosley在一份声明中表示,“希捷是全球唯一一家拥有单盘片3 TB存储密度的硬盘制造商,而且这个数字将很快提升至5 TB。随着AI用例对于原始数据集的高度重视,越来越多的企业将需要存储更多数据。为了容纳规模庞大的数据总量,盘片密度的意义将比以往任何时候都更加重要。”
在大型数据中心领域,使用传统垂直磁记录(PMR)技术的驱动器的平均容量为16 TB。而在升级到Exos 30 TB Mozaic 3+技术之后,磁盘驱动器在同等物理体积下的存储容量几乎翻倍。公司CTO John Morris解释称,“我们的首款产品即将通过全面的技术认证,本季度之内就将完成。也就是说……这款高容量产品将从本季度内起全面出货。”
希捷还提到,面对数据中心客户的强劲需求,对Mozaic 3+的认证将快马加鞭并进入量产阶段。同样是在本季度内,Exos的30 TB以上产品也将向超大规模云运营商客户出货。
新款驱动器将分为三个版本:
· 传统版容量为30 TB。
· 采用重叠写入磁道的叠瓦式(SMR)驱动器容量为36 TB左右,相当于用写入速度换取更高容量。
· 同时采用传统磁道加叠瓦式磁道的混合SMR驱动器容量在24到32 TB之间,主要面向谷歌等云服务商。
希捷的HAMR Mozaic 3+平台属于一整套技术组合,首先就是用于介质记录层的超晶格铁铂合金。其结晶尺寸比现有磁盘介质更小,而且在室温水平下拥有更高的矫顽力,即对磁极方向变化的抵抗力。但只要对bit区域施加高强度、局部化的热量则可降低矫顽力,从而使数据bit能够按照磁极方向(N或S)完成写入。
负责将数据bit写入介质的则是等离子体写入器。这种写入器包含多种元件,首先就是纳米光子激光器。其830纳米的光子脉冲通过光子隧道或波导到达量子天线(一种近线换能器),再由量子天线将脉冲聚焦至介质表面一个35纳米的光斑上,从而实现400摄氏度以上的加热温度。
相较于激光器830纳米的输出区域,这个光斑明显要小得多。Morris解释道,普通光学器件只能将激光脉冲聚焦至200纳米左右,“但由于我们使用的是等离子体效应,因此可以让产生的光斑远小于普通光学器件的衍射极限。具体来讲,我们可以借此让激光产生35纳米大小的光斑。”
“激光发出的光子与天线相互作用,进而对共振电子进行集体激发。我们可以通过天线将共振直接耦合到介质当中,并在介质中产生一个定位精确、尺寸极小的能量汇聚点。”
希捷量子天线中的等离子体效应。
用于激发等离子体效应的量子天线,其实就是一个等离子体谐振器。光子在撞击盘状金属表面之后,会在表面上产生电流以及相应的电磁场,也就是表面等离子体。这些表面等离子体沿磁盘边缘移动,进而环绕面向盘片介质表面的金属钉。这些金属钉的宽度为35纳米,因此环绕其上的等离子体也将以35纳米光斑的形式加热金属钉下方的介质表面。
在写入之后,bit区域的光斑逐渐冷却,磁极方向也归于稳定。整个加热与冷却循环大约需要1纳秒。尽管盘片始终保持着每分钟7200转的旋转速度,但激光脉冲的速度太快,因此盘片与量子天线之间几乎保持相对静止。
但技术难题尚未彻底被克服。希捷计划将纳米光子激光器垂直集成至等离子体写入器子系统当中。Mosley介绍称,“我们希望在Mozaic 3+之内进一步开发这种独特的激光技术,保障更高的效率和产能,从而支持后续快速扩大生产。”
而在已记录数据bit的读取过程中,则要用到希捷最新的第七代自旋电子读取器,其几何形状发生了变化以适应比以往更小的数据读取bit区域。
整个读写子系统均由希捷内部开发的12纳米片上系统控制器负责管理。
希捷还强调了其HAMR技术的环保属性,表示相较于传统16 TB PMR驱动器,采用Mozaic 3+技术的30 TB驱动器的每TB隐性碳排放减少了55%。
希捷还公布了一份HAMR硬盘容量的发展路线图。Morris指出,“我们制定了一份Mozaic 4的开发时间表,计划每盘片可提供4 TB容量。而到Mozaic 5,单盘片存储容量将进一步提升至5 TB。”
希捷公布的HAMR驱动器容量路线图。
需要注意的是,这里指的是单盘片存储容量,而非整个驱动器。Mozaic 4+技术将把磁盘驱动器的总容量提升至40 TB以上,而Mozaic 5+更有望让希捷打造出50 TB驱动器。
希捷援引IDC的数据称,在2022年至2025年期间,全球数据需求将增加一倍以上。生成式AI的繁荣预计将持续推动数据存储需求。Morris指出,“我们有理由相信,AI技术爆发将进一步推高数据存储需求,只是在AI基础设施的投入层面表现得相对滞后。”
再结合数据中心被迫为GPU服务器划拨大量供电配额的背景,客户在存储更多数据的同时,还必须想办法减少磁盘机械的供电和冷却能耗。相较于现有驱动器,采用运行功耗更低、存储容量更高的新一代驱动器能够节约占地面积,同时减少需要冷却的磁盘数量。
这意味着希捷将在市场上将拥有压倒西部数据和东芝的相对强势地位。后两家公司都在使用微波辅助磁记录(MAMR)技术来提高传统PMR驱动器的容量上限。
西部数据目前拥有24 TB传统存储加28 TB叠瓦存储的产品组合,而东芝只掌握22 TB传统存储驱动器,双方在容量上明显处于劣势。
但两家公司均表示,未来将逐步转向HAMR技术。由于希捷计划在2026年底之前实现40 TB传统存储与46至48 TB叠瓦存储的新目标,并在2028年底之前推出50 TB传统存储与56至60 TB叠瓦存储产品,所以西部数据和东芝恐怕得抓紧行动起来。
希捷还计划将旗下所有磁盘产品全面转向HAMR技术,借此减少盘片数量以降低30 TB以下磁盘的成本。例如,采用10张2 TB盘片的20 TB驱动器可以转换为基于HAMR技术的7张3 TB盘片产品,这不仅能够减少盘片制造需求,也将相应拉低读/写磁头成本和设备运行功耗。
总体而言,希捷公司显然打算在容量、每TB成本和能效(每TB运行功耗)等指标上全面碾压竞争对手。
好文章,需要你的鼓励
上海交通大学研究团队利用影响函数揭示了数据特征如何刺激大型语言模型的数学和代码推理能力。研究发现高难度数学问题能同时提升数学和代码推理,而低难度编程任务对代码推理最有效。基于此,他们提出了"任务难度翻转"策略,使模型在AIME24准确率翻倍至20%。细粒度分析还显示,探索性思维行为对推理有积极影响,而数学推理偏好逻辑连接词,代码推理则强调结构化语法。这些发现为优化AI训练数据提供了重要指导。
本研究提出了"能力-难度对齐采样"方法(CDAS),革新了大型语言模型强化学习训练中的数据采样策略。与传统方法不同,CDAS通过聚合历史表现差异实现更稳定的问题难度估计,并将模型能力与问题难度动态匹配。在多个数学推理基准测试中,CDAS达到了46.77%的最高平均准确率,同时比竞争策略提高了2.33倍的计算效率。研究还证明了CDAS在代码生成任务和更大型模型上的有效性,为提升大型语言模型的推理能力提供了高效可靠的新方法。
InfantAgent-Next是一款突破性的多模态通用型AI助手,能通过文本、图像、音频和视频与计算机进行交互。不同于现有方法,它采用高度模块化架构,将基于工具和纯视觉的代理技术融为一体,让不同模型能逐步协作解决分散任务。在OSWorld视觉测试中达到7.27%的准确率,超越Claude-Computer-Use;同时在代码处理基准SWE-Bench和通用任务平台GAIA上也表现出色。其开源设计不仅提供了丰富工具集,还优化了鼠标点击定位和文件编辑功能,为AI自动操作计算机开创了新范式。
KAIST等机构研究团队提出的"覆盖原则"框架揭示了大语言模型在组合泛化能力上的基本局限。研究表明,依赖模式匹配的模型只能泛化到那些可以通过替换功能等价片段到达的输入。实验证实,两步推理任务的训练数据需求与词表大小成二次方增长,且增加模型参数并不改善这种关系;路径歧义任务会导致模型形成上下文依赖的表示;思维链监督虽能提高效率但仍受覆盖限制。研究最终提出三类泛化机制的分类法,为理解组合推理和真正系统性泛化所需的创新提供了清晰路径。