本文组织:
1. 机械硬盘市场状况
2. SMR/HAMR/MAMR
3. 14TB非SMR充氦硬盘
4. GMA技术
5. 应用场景
6. 即将登场
1、机械硬盘市场状况
不可否认,机械硬盘市场在固态介质时代受到了严重的冲击,尤其是在个人消费领域,如上图所示,份额下滑比较明显。但是另一方面,随着数据量的暴增,在视频监控领域以及企业级市场的份额其实是增长的。而冬瓜哥认为个人消费类市场的数据备份这个细分市场也是增长的,因为目前大量的个人照片视频等数据备份需求也是空前暴增。之前买过的一个4TB的移动硬盘,马上就要满了。如果只看容量的话,整个硬盘市场对容量需求是逐年增加的。
2、SMR/HAMR/MAMR
众所周知,机械硬盘产品的性能基本上已经到顶了,但是容量和密度仍然在缓慢增长过程中。两三年前,SMR(叠瓦式磁记录)技术崭露头角,其原理是将磁道排布的非常紧密,导致磁头的写磁头部分的磁场信号会同时磁化2个磁道,于是在改变某个磁道数据之前必须先将即将被误伤的磁道的数据临时读出到缓冲区,改写之后再将数据恢复回去,会产生写惩罚。这种做法相当低效,但是却可以大幅提升硬盘的单碟密度到1.33TB每碟片。冬瓜哥还有一项发明专利,给出了一种能够一定程度上临时提升SMR硬盘性能的数据排布方式。
然而,SMR硬盘在市场上似乎并没有得到广泛响应,其原因是它的应用场景过于狭窄,针对那些Write once Read many(WORM)场景,或者大块顺序写场景,尤为合适。而对于那些随机写入场景,则性能比较差。需要上层软件做出一些修改和适配才能够更好的保障其在此场景下的性能。这也就是所谓的host aware和host managed模式。SMR的这些特性,导致SCSI协议不得不增加一个Zone Command子指令集,对生态提出了要求,不仅OS内核SCSI协议栈需要更改,Raid/HBA卡的firmware/driver也都需要跟着适配。这就难免会产生兼容性问题。实际上,SMR在应用中的确收到了较大阻力。
除了SMR技术,还有一些其他技术可提升容量。稍前有其他的存储厂商提出了微波磁记录存储技术(MAMR)和热辅助磁记录存储技术(HAMR),这两者其实本质上类似,都是通过激光/微波来临时改变磁性材料的物理性质而让其变得更易磁化。这两个技术据说可在2023-2025年左右把机械硬盘容量提高到40TB。
虽然硬盘厂家都在开发新的技术想让硬盘的存储密度变得更大,然而无论是HAMR热辅助磁记录技术还是MAMR微波辅助磁纪录技术在短时间内还是没法投入实际应用,那么尝试冲击传统技术的极限也不失为一个办法。
目前,市场上已推出的12TB和14TB非SMR硬盘(或者说CMR,Conventional Magnetic Recording)盘,其采用的依然是SMR技术,密度达到单碟1.75TB。而东芝之前的最高容量为10TB非SMR盘(采用PMR垂直记录,单碟1.43TB)。
3、14TB非SMR充氦硬盘
2018年农历年刚过,东芝终于发布了全球最高容量的CMR(非SMR)盘,其14TB的容量再次将非SMR盘的容量又提升到了一个新极限数字,成为业界容量最高的CMR机械硬盘。
本次发布了12TB和14TB两个容量型号。采用9碟装,氦气密封。这也是东芝首次发布充氦硬盘。
东芝本次发布的硬盘的两个最大亮点是非SMR、充氦气、镭射封装、首款9碟设计。
SMR技术不利于随机写场景。但是传统的CMR却没有这个问题。东芝表示虽然目前企业服务器和存储客户都意识到采用SMR技术可以有效提升硬盘的容量,但SMR硬盘产品在服务器和存储系统中的采用是需要几年时间的来过渡的,现在东芝则可以为业界提供一款传统的垂直写入硬盘而不是SMR硬盘。本次发布的硬盘型号依然使用PMR垂直记录技术碟片,14TB的有9张碟片18个磁头,而12TB的则是8碟片16磁头,两者的转速均是7200RPM并配备256MB的缓存,采用SATA 6Gbps接口,性能方面14TB的读写速度是260MB/s,而12TB的是250MB/s,MTBF是250万小时,质保期5年。
得益于充氦技术,东芝MG07ACA系列可比上代MG06ACA堆叠更多的碟片,使最大容量增加了40%。在装入如此多的碟片后,传统的盘内空气环境将无法满足设计需求。氦气的密度比空气低得多,所以使得磁碟的空气阻力也更低,可以更好的控制功耗以及散热。
得益于镭射封装技术,可以确保氦气在整个生命周期内不会泄露掉。由于整个硬盘处于密封状态,所以其可以用于液冷场景,将整个服务器系统连同硬盘一同浸泡在导热绝缘液体中。
4、GMA技术
东芝这一代硬盘采用GMA致动技术。硬盘磁头臂被安置在一个转轴上,其尾部依靠音圈电机实现精确步进。但是随着碟片磁道密度不断提升,单单依靠该主轴已经无法做到精确同时迅速的定位。而DSA技术(Dual Stage Actuator)在磁头臂前端增加了一个微调定位部件,这样经过主轴和这微调部件共同作用可以实现更加精确的迅速的定位。
而DSA的升级版GMA技术,则将该微调部件做的更加小而精,进一步提高了定位精度,可以满足本代硬盘的磁道密度要求。下面是一段动图展示DSA和GMA技术。
5、应用场景
对于一些高压力在线业务,SSD毋庸置疑已经是理想选择。但是鉴于机械盘+Raid卡组合的根基非常强大,多数场景下,在满足需求前提下后者的成本还是要低于前者。尤其对于企业级存储系统而言,SAS接口依然是不可或缺的,因为可以做到双冗余,而SAS接口的SSD的成本依然高昂。加之不管是传统的SAN存储系统还是新兴的分布式存储系统,其对成本要求都很高,SSD的全面替换短期还不可能。所以,利用中等容量、高数量的机械硬盘,加Raid卡或者SAN存储控制器搭建企业级存储系统依然还是主流。
而这种高容量的14TB硬盘现在看来对于个人应用而言是一个不小的数字,可能5年内你都存不满它。但是对于企业级冷数据、视频监控而言,容量密度多多益善。
6、即将登场
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。