根据IDC的数据统计,全球数字信息存储需求依然呈现出快速增长态势,疫情持续与半导体缺货双重影响下,数据存储需求的增速有增无减。2020年至2025年,全球范围内,每年所产生的数据量复合增长率达23%,而中国市场更是从14ZB增加到41ZB、复合增长率更是达到24%。而与此同时,其中能够被存储下来的数据只是其中的很小一部分,因为届时每年新生产的存储设备容量仅几ZB,远远不能满足市场需求。
这几年,个人消费者并未直接感受到自身存储需求有所提升,无论是智能手机的数百GB存储空间还是PC的数TB存储空间增长停滞,都是建立在支持它们的数据中心、云存储快速增长的背景下的。在SSD产品年复合增长率高达43%的同时,HDD同样保持了27%的高增长速度,也从侧面印证了用户对数据容量依旧保持强烈需求。西部数据公司副总裁兼中国区业务总经理刘钢表示,“除了容量,用户对快数据的需求也非常急迫,不仅要存储数据,还要挖掘数据的价值,真正把数据用于分析、预测和决策。可以简单地理解为HDD支持的是大数据,而是SSD支持快数据的需求。”
近日,在西部数据举办的“数智创新 芯存未来”媒体分享会上,西部数据公司HDD业务部高级副总裁Ravi Pendekanti宣布其搭载了OptiNAND技术的20TB Ultrastar DC HC560产品的正式发布,且正在和多家互联网及云服务企业沟通进行部署测试,帮助用户高效应对在容量、性能及能耗方面的诸多挑战。
西部数据公司HDD业务部高级副总裁Ravi Pendekanti
Ravi进一步表示,西部数据已开始批量出货这款单盘容量高达20TB的ePMR HDD,其首款产品Ultrastar DC HC560单碟容量高达2.2TB。
刘钢指出:“西部数据拥有从Flash到HDD的全产业链技术,一方面不断推进Flash产品不断丰富细化,满足从企业级用户到消费级的全解决方案。”根据其透露的信息,西部数据采用BiCS5技术的3D NAND已经实现112层产品的量产,今年还推出了162层的3D NAND技术,即在3D NAND问世的6年内,从实现了从48层到162层近3.4倍的层数增加。
西部数据公司副总裁兼中国区业务总经理刘钢
垂直整合能力更体现在跨产品技术领域,相比单一Flash产业链资源,西部数据致力于将其与HDD产品创新相结合,前面提到的OptiNAND技术,就是这样一个突破。利用NAND介质的性能与功能优势为HDD加速的技术概念屡见不鲜,但是它们都未触及制约HDD性能、容量进一步发挥的机械结构内部。
经过早期的宣传,SMR、EAMR(MAMR、HAMR等)等诸技术已深入人心,但是市场接受度有限或距离上市尚有时日。
OptiNAND技术结合了西部数据在Flash技术和HDD产品上的双重优势,HDD机械结构仅需小幅调整,就能配合HelioSeal(氦气封装)、TSA(三阶寻轨定位系统)、ePMR(能量辅助存储)等HDD创新技术,实现性能上的飞跃。自9月正式发布以来,仅仅2个多月,采用这一系列技术的Ultrastar DC HC560就实现了容量与速度的提升、规模出货,并获得了用户的认可。
存储磁盘元数据的3D NAND闪存以iNAND UFS的形态嵌入HDD,创新的专有固件算法及更新的的全新磁盘架构设计,进一步推升HDD的容量、性能和可靠性,降低功耗及TCO。截止至目前,采用相关ePMR技术的产品已部署超过100EB。
在谈到国内合作伙伴的生态布局方面,刘钢介绍了携手联想及SmartX赋能金融客户数字化转型、联手H3C与星环科技助力企业实现数据资产化、联合沃趣为金融企业提供卓越的云架构体验等诸多客户案例,深刻印证了西部数据深耕中国市场,不断通过创新的存储解决方案赋能合伙伙伴、为客户创造价值。
刘钢总结道:西部数据是一家同时拥有HDD和闪存技术的公司,我们提供的产品背后是从芯片到系统的完整产品线。我们专注在存储领域十多年了,是存储行业的重要贡献者。未来,我们希望可以跟更多国内生态伙伴一起,为整个存储市场提供优化的存储解决方案。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。