随着IOT的普及以及5G、AI、大数据等新技术和应用的发展,连接到互联网的设备数量和云服务范围正在高速增加。伴随而来的是通过互联网产生的数据量呈现指数级增长。因此对于企业和个人来讲,海量数据存储需求成为核心需求。特别是对于云计算提供商和云服务公司的数据存储能力提出挑战。
企业级数据存储的主要介质依旧是硬盘
IDC发布《数据时代 2025》 预测,2025年全球数据将攀升至163ZB 。同时IDC指出,即使到了2025年,未来企业级数据存储的主要介质依旧是机械硬盘。
这是因为对数据中心数据存储来讲,经济高效的企业级硬盘也在不断的通过技术创新来提高其数据存储容量和电源效率。实现整个数据中心TCO降低的核心需求。
2019年1月技术系统研究报告显示,2017年至2023年期间,数据中心的企业级HDD总容量预计将以每年约30%的速度增长。因此,到2023年,总容量将达到约1200艾字节(EB),这是2017年的四倍。在这种情况下,企业级硬盘制造商正努力增加每个硬盘单元的存储容量。因为具有更高容量的HDD有助于降低每单位存储中每GB的功耗和占用空间,从而降低数据中心的总体拥有成本。
东芝大力推动大容量企业级硬盘满足市场需求
基于市场的需求,包括东芝在内的所有硬盘制造商都在致力于开发技术以提高其容量。2017年12月,东芝在业内率先使用传统磁记录(CMR)技术,发布了3.5英寸外形尺寸规格的14 TB企业级容量型SATA硬盘,即所谓的MG07ACA系列。
14TB HDD MG07ACA企业级容量型SATA硬盘。该系列机械硬盘采用了3.5寸SATA型标准硬盘设计,转速7200 PRM,拥有高达256MiB的缓存容量。东芝MG07ACA的理论顺序读写速度接近250MB/s,MTTF为250万小时,更为令人惊叹的是其功耗:14TB款的功耗仅为4.22W。东芝MG07ACA 14TB机械硬盘内部采用9盘片充氦封装设计,专为企业存储和云打造。为了提高寿命,它采用了传统的CMR磁记录技术,相较新锐的SMR技术拥有更强的耐用性。此外,它还采用了第二代制动磁头技术,极大提高了数据响应速度。
大约在一年后的2019年1月,东芝又发布了16TB大容量企业级硬盘,名为MG08系列。MG08系列硬盘除了氦气填充和九盘片封装技术之外,MG08系列还引入了二维磁记录(TDMR)技术。我们知道CMR每个磁头使用一个写入器和一个阅读器,而TDMR每个磁头使用两个阅读器来增加读取信号的信噪比。但是随着磁录密度的增加,磁道间距变小。相邻的磁道将趋向于“流苏状”或相互干扰,两个阅读器是否对读取精度产生不利影响呢?为了缓解这个问题,TDMR使用跨越相邻磁道的两个阅读器来测量和抵消磁道之间的干扰。因此TDMR提供比传统单阅读器技术更高的读取精度。
东芝氦气封装技术优势在哪里?
2017年东芝基于氦气密封的14TB的企业级硬盘出现之后,在云数据中心和企业级市场取得了关注。为什么氦气硬盘能够实现更大容量和更低功耗呢?
那是因为相对于传统的空气盘,因为氦气分子的质量比空气小,大大减少了旋转磁盘上的空气阻力,从而也有助于减少磁头悬挂组件的振动和磁盘盘片在每分钟高转速(RPM)下的晃动。这反过来也有助于提高每个磁盘的跟踪精度和磁录密度,同时也可以缩短盘片之间的距离。此外,氦气降低了作用在旋转盘片上的阻力,从而降低了主轴电机的功耗,同时也降低了与主轴电机运行相关的热量。
同时硬盘的密封技术也很重要。,要让氦气发挥作用,需要密封技术将氦气密封在硬盘内部。东芝集团在开发精密激光焊接技术方面具有历史悠久的领导地位,这种精密激光焊接技术用于焊接硬盘外壳的顶盖,以便在硬盘的使用寿命周期内将氦气安全密封在硬盘内部。
未来,东芝将继续推动海量硬盘技术创新
自2017年12月开始制样以来,MG07ACA企业级硬盘系列因其高容量而受到许多客户的高度重视。2018年7月,已启动量产并向一些数据中心客户发货。比如MG07ACA系列已经应用包括Supermicro等厂商的存储服务器设备上。同时MG07系列的使用也已经在需要严格可靠性的地方,例如专门从事自动驾驶车辆算法开发的研究机构和数据中心。
我们也看到东芝硬盘未来的路线图目前已经计划推出18TB和20TB的大容量企业硬盘。18TB和20TB的大容量企业硬盘将采用微波辅助磁记录(MAMR)技术。同时东芝正在研究HAMR技术以用于未来的产品。核心目标是持续为企业级市场提供高密度、低功耗的海量硬盘。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。