“我们并没有更好的算法,我们只不过是拥有更多的数据。”——Google研究总监Peter Norvig。
今天,几乎所有企业都认识到数据的重要性,但是,今天创建的数据和被存储的数据仍然存在巨大鸿沟。IDC调研显示,2025年创建的175ZB的数据中,被保存的仅有17ZB,而真正被分析和变现的数据更是少之又少。
在数据存储方面目前面临的主要问题是成本高昂和管理复杂,企业被迫在数据经济的成本与价值中间做出妥协。要存储更多数据,就需要基础设施成本、运营成本、人力资源成本等等。
目前希捷等硬盘厂商推出了18TB、20TB的企业级硬盘。但是长期以来除了互联网企业、谷歌、微软等巨头能够第一时间使用最新的大容量硬盘之外,包括运营商、传统企业等绝大多数企业目前采用的硬盘还都是4TB、8TB。一个重要原因是硬盘的容量越大,就需要更长时间和更多精力来进行优化,以实现大容量硬盘的性能和容量最优。
希捷科技全球副总裁暨中国区总裁孙丹
最近,希捷推出了100%开源对象存储软件CORTX,能够针对目前的18TB、20TB以及未来更大容量硬盘进行优化,助力更多企业可以第一时间以更低成本享受到大容量硬盘的容量和性能。
近日,希捷科技全球副总裁暨中国区总裁孙丹接受至顶网等媒体的采访,分享了希捷CORTX开源对象存储软件对企业客户的重要意义。
“更大容量硬盘能够大幅度降低存储架构的TCO,比如按照PB级的存储量来看,采用18TB大容量硬盘的TCO相对于8TB大容量硬盘的TCO降低32%。“孙丹分享到。
希捷推出CORTX的核心目的是让更多的企业能够享受到大容量硬盘的优势。对于很多企业而言,想要高效地利用大容量硬盘,需要在系统上面做很多调优工作,而目前只有互联网等行业领先客户可以做到。
“一个互联网公司,从12TB转到16TB,要一年甚至更长的时间来调整自己的软件才能顺利部署。大家想想,互联网企业有自己的能力,但是也要花很长时间才能把容量和性能调到最优。如果用我们的CORTX,所有客户都可以很方便地把双磁臂技术以及大容量硬盘全都用上,而且不需要花很多的时间去调优。”孙丹形象生动的分享了CORTX的价值。
希捷科技中国区资深解决方案工程师李蓁从技术应用角度分享了CORTX的优势。
首先,针对新型应用,CORTX更容易实现数据的标注和检索。“人工智能、机器学习是未来数据领域更主流的应用,用户可以直接基于CORTX开源软件对硬盘上的数据进行标注,实现高效检索,加速算法训练和迭代。” 李蓁谈到。
第二、实现软硬件的垂直整合,大幅度降低TCO。“行业里面在使用大容量盘的时候会遇到非常多的挑战,作为大容量硬盘的开发者,希捷非常了解硬件产品,所以我们设计的对象存储软件非常方便,用户可以直接享受到使用大容量硬盘所带来的TCO降低。”
第三、极大地降低使用纠删码时所需要配置的内存。“目前的开源存储软件要达到比较理想的纠删码呈现效率,每TB的硬盘容量大概需要对应1GB内存容量,所以这个对用户来说造成了额外的成本支出。通过CORTX,用户可以实现部署的轻量化,而且交付也会更简单。”
可以看到,CORTX是独立于硬件的开源对象存储软件,为开发者和合作伙伴提供针对大容量优化的数据存储架构,能够支撑希捷基于HAMR和MACH.2技术的大容量硬盘,大幅度释放性能和容量,既可以帮助企业进行超大规模存储架构的应用和普及,又能实现有效、快速且经济地部署对象存储。
好文章,需要你的鼓励
Anthropic周一发布了旗舰模型Opus 4.5,这是4.5系列的最后一个模型。新版本在编程、工具使用和问题解决等基准测试中表现出色,是首个在SWE-Bench验证测试中得分超过80%的模型。同时推出Claude for Chrome和Claude for Excel产品,分别面向不同用户群体。Opus 4.5还改进了长文本处理的内存管理,支持付费用户的"无限聊天"功能,并针对智能体应用场景进行了优化,将与OpenAI的GPT 5.1和谷歌的Gemini 3展开竞争。
南洋理工大学团队开发了Uni-MMMU基准测试,专门评估AI模型的理解与生成协同能力。该基准包含八个精心设计的任务,要求AI像人类一样"边看边想边画"来解决复杂问题。研究发现当前AI模型在这种协同任务上表现不平衡,生成能力是主要瓶颈,但协同工作确实能提升问题解决效果,为开发更智能的AI助手指明了方向。
总部位于圣地亚哥的AI公司耐能发布新一代KL1140芯片,这是首款能在边缘端运行完整变换器网络的神经处理单元。该芯片可将大语言模型从云数据中心转移到便携式本地设备中,四颗芯片组合可实现类似GPU的性能,支持1200亿参数模型运行,功耗降低三分之一至一半,硬件成本减少十倍。
360 AI Research团队发布的FG-CLIP 2是一个突破性的双语精细视觉语言对齐模型,能够同时处理中英文并进行精细的图像理解。该模型通过两阶段训练策略和多目标联合优化,在29个数据集的8类任务中均达到最先进性能,特别创新了文本内模态对比损失机制。团队还构建了首个中文多模态评测基准,填补了该领域空白,为智能商务、安防监控、医疗影像等应用开辟新可能。