“我们并没有更好的算法,我们只不过是拥有更多的数据。”——Google研究总监Peter Norvig。
今天,几乎所有企业都认识到数据的重要性,但是,今天创建的数据和被存储的数据仍然存在巨大鸿沟。IDC调研显示,2025年创建的175ZB的数据中,被保存的仅有17ZB,而真正被分析和变现的数据更是少之又少。
在数据存储方面目前面临的主要问题是成本高昂和管理复杂,企业被迫在数据经济的成本与价值中间做出妥协。要存储更多数据,就需要基础设施成本、运营成本、人力资源成本等等。
目前希捷等硬盘厂商推出了18TB、20TB的企业级硬盘。但是长期以来除了互联网企业、谷歌、微软等巨头能够第一时间使用最新的大容量硬盘之外,包括运营商、传统企业等绝大多数企业目前采用的硬盘还都是4TB、8TB。一个重要原因是硬盘的容量越大,就需要更长时间和更多精力来进行优化,以实现大容量硬盘的性能和容量最优。
希捷科技全球副总裁暨中国区总裁孙丹
最近,希捷推出了100%开源对象存储软件CORTX,能够针对目前的18TB、20TB以及未来更大容量硬盘进行优化,助力更多企业可以第一时间以更低成本享受到大容量硬盘的容量和性能。
近日,希捷科技全球副总裁暨中国区总裁孙丹接受至顶网等媒体的采访,分享了希捷CORTX开源对象存储软件对企业客户的重要意义。
“更大容量硬盘能够大幅度降低存储架构的TCO,比如按照PB级的存储量来看,采用18TB大容量硬盘的TCO相对于8TB大容量硬盘的TCO降低32%。“孙丹分享到。
希捷推出CORTX的核心目的是让更多的企业能够享受到大容量硬盘的优势。对于很多企业而言,想要高效地利用大容量硬盘,需要在系统上面做很多调优工作,而目前只有互联网等行业领先客户可以做到。
“一个互联网公司,从12TB转到16TB,要一年甚至更长的时间来调整自己的软件才能顺利部署。大家想想,互联网企业有自己的能力,但是也要花很长时间才能把容量和性能调到最优。如果用我们的CORTX,所有客户都可以很方便地把双磁臂技术以及大容量硬盘全都用上,而且不需要花很多的时间去调优。”孙丹形象生动的分享了CORTX的价值。
希捷科技中国区资深解决方案工程师李蓁从技术应用角度分享了CORTX的优势。
首先,针对新型应用,CORTX更容易实现数据的标注和检索。“人工智能、机器学习是未来数据领域更主流的应用,用户可以直接基于CORTX开源软件对硬盘上的数据进行标注,实现高效检索,加速算法训练和迭代。” 李蓁谈到。
第二、实现软硬件的垂直整合,大幅度降低TCO。“行业里面在使用大容量盘的时候会遇到非常多的挑战,作为大容量硬盘的开发者,希捷非常了解硬件产品,所以我们设计的对象存储软件非常方便,用户可以直接享受到使用大容量硬盘所带来的TCO降低。”
第三、极大地降低使用纠删码时所需要配置的内存。“目前的开源存储软件要达到比较理想的纠删码呈现效率,每TB的硬盘容量大概需要对应1GB内存容量,所以这个对用户来说造成了额外的成本支出。通过CORTX,用户可以实现部署的轻量化,而且交付也会更简单。”
可以看到,CORTX是独立于硬件的开源对象存储软件,为开发者和合作伙伴提供针对大容量优化的数据存储架构,能够支撑希捷基于HAMR和MACH.2技术的大容量硬盘,大幅度释放性能和容量,既可以帮助企业进行超大规模存储架构的应用和普及,又能实现有效、快速且经济地部署对象存储。
好文章,需要你的鼓励
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。