“我们并没有更好的算法,我们只不过是拥有更多的数据。”——Google研究总监Peter Norvig。
今天,几乎所有企业都认识到数据的重要性,但是,今天创建的数据和被存储的数据仍然存在巨大鸿沟。IDC调研显示,2025年创建的175ZB的数据中,被保存的仅有17ZB,而真正被分析和变现的数据更是少之又少。
在数据存储方面目前面临的主要问题是成本高昂和管理复杂,企业被迫在数据经济的成本与价值中间做出妥协。要存储更多数据,就需要基础设施成本、运营成本、人力资源成本等等。
目前希捷等硬盘厂商推出了18TB、20TB的企业级硬盘。但是长期以来除了互联网企业、谷歌、微软等巨头能够第一时间使用最新的大容量硬盘之外,包括运营商、传统企业等绝大多数企业目前采用的硬盘还都是4TB、8TB。一个重要原因是硬盘的容量越大,就需要更长时间和更多精力来进行优化,以实现大容量硬盘的性能和容量最优。
希捷科技全球副总裁暨中国区总裁孙丹
最近,希捷推出了100%开源对象存储软件CORTX,能够针对目前的18TB、20TB以及未来更大容量硬盘进行优化,助力更多企业可以第一时间以更低成本享受到大容量硬盘的容量和性能。
近日,希捷科技全球副总裁暨中国区总裁孙丹接受至顶网等媒体的采访,分享了希捷CORTX开源对象存储软件对企业客户的重要意义。
“更大容量硬盘能够大幅度降低存储架构的TCO,比如按照PB级的存储量来看,采用18TB大容量硬盘的TCO相对于8TB大容量硬盘的TCO降低32%。“孙丹分享到。
希捷推出CORTX的核心目的是让更多的企业能够享受到大容量硬盘的优势。对于很多企业而言,想要高效地利用大容量硬盘,需要在系统上面做很多调优工作,而目前只有互联网等行业领先客户可以做到。
“一个互联网公司,从12TB转到16TB,要一年甚至更长的时间来调整自己的软件才能顺利部署。大家想想,互联网企业有自己的能力,但是也要花很长时间才能把容量和性能调到最优。如果用我们的CORTX,所有客户都可以很方便地把双磁臂技术以及大容量硬盘全都用上,而且不需要花很多的时间去调优。”孙丹形象生动的分享了CORTX的价值。
希捷科技中国区资深解决方案工程师李蓁从技术应用角度分享了CORTX的优势。
首先,针对新型应用,CORTX更容易实现数据的标注和检索。“人工智能、机器学习是未来数据领域更主流的应用,用户可以直接基于CORTX开源软件对硬盘上的数据进行标注,实现高效检索,加速算法训练和迭代。” 李蓁谈到。
第二、实现软硬件的垂直整合,大幅度降低TCO。“行业里面在使用大容量盘的时候会遇到非常多的挑战,作为大容量硬盘的开发者,希捷非常了解硬件产品,所以我们设计的对象存储软件非常方便,用户可以直接享受到使用大容量硬盘所带来的TCO降低。”
第三、极大地降低使用纠删码时所需要配置的内存。“目前的开源存储软件要达到比较理想的纠删码呈现效率,每TB的硬盘容量大概需要对应1GB内存容量,所以这个对用户来说造成了额外的成本支出。通过CORTX,用户可以实现部署的轻量化,而且交付也会更简单。”
可以看到,CORTX是独立于硬件的开源对象存储软件,为开发者和合作伙伴提供针对大容量优化的数据存储架构,能够支撑希捷基于HAMR和MACH.2技术的大容量硬盘,大幅度释放性能和容量,既可以帮助企业进行超大规模存储架构的应用和普及,又能实现有效、快速且经济地部署对象存储。
好文章,需要你的鼓励
微软高级软件工程师Alice Vinogradova将自己用SAP ABAP语言编写的向量数据库ZVDB移植到了搭载Z80处理器的经典计算机Sinclair ZX Spectrum上。她发现ABAP(1983年)和Z80(1976年)几乎是同时代产物,都诞生于内存珍贵、每个字节都很重要的计算时代。通过应用Z80优化技术,尽管时钟频率相差857倍,但代码运行速度仅慢3-6倍。她认为这些老式优化技术具有普遍适用性,在现代硬件上依然有效。
这项由东京科学技术大学等机构联合发布的研究提出了UMoE架构,通过重新设计注意力机制,实现了注意力层和前馈网络层的专家参数共享。该方法在多个数据集上显著优于现有的MoE方法,同时保持了较低的计算开销,为大语言模型的高效扩展提供了新思路。
韩国电子巨头三星宣布收购美国西雅图数字健康技术公司Xealth,进一步扩大在健康领域的布局。Xealth专注于帮助医疗专业人员将数字健康技术整合到日常实践中,与70多家数字健康技术供应商合作,应用覆盖美国500多家医院。此次收购将推动三星向连接医疗保健平台转型,结合其在传感器技术和可穿戴设备方面的优势,完善Samsung Health平台功能。
小米团队开发的MiMo-7B模型证明了AI领域"小而精"路线的可行性。这个仅有70亿参数的模型通过创新的预训练数据处理、三阶段训练策略和强化学习优化,在数学推理和编程任务上超越了320亿参数的大模型,甚至在某些指标上击败OpenAI o1-mini。研究团队还开发了高效的训练基础设施,将训练速度提升2.29倍。该成果已完全开源,为AI民主化发展提供了新思路。