自从IBM整合红帽旗下Ceph存储产品路线图已经过去了一年,如今这项技术已经在日益由AI主导的应用环境下取得进展。
Gerald Sternagl
IBM Storage Ceph技术产品经理Gerald Sternagl在日前发布的博文中表示,“这套具备自我修复与自我管理功能的平台,强调在行业标准硬件之上以规模化方式提供统一的文件、块和对象存储服务。统一存储平台将为客户提供重要的跨架构桥梁,能够将运行在独立文件或块存储上的遗留应用程序同对象存储共同囊括在同一设备之内。”
博文解释称,“在数据管理领域,软件定义存储已经成为一股变革性的力量。与传统存储阵列相比,其拥有诸多优势,包括极高的灵活性与可扩展性,特别适合处理生成式AI等现代用例。”
Sternagl对于IBM的传统存储阵列硬件(例如大型机DS8000以及x86服务器FlashSystem阵列等)持批评态度。且在被蓝色巨人收购之前,他已经作为资深专家为红帽工作了十余年。
在他看来,“Ceph针对大型单站点与多站点部署进行了优化,能够高效扩展以支持数百PB的数据和数百亿个存储对象,从而为传统及新兴生成式AI等工作负载提供至关重要的支持。”Ceph能够适应数据湖仓、AI/机器学习开源框架以及其他“较为传统的工作负载,包括红帽OpenShift以及RedHat OpenStack上的MySQL与MongoDB。”
“生成式AI已经在大量非结构化数据的基础之上迎来了蓬勃发展,并由此建立起新的反馈循环。具体来讲,AI能够不断生成真实数据以进一步丰富并完善我们对非结构化数据集的理解,持续促进技术创新与进步。”
IBM用于数据、分析及AI工作负载的数据湖仓架构watsonx.data中,就包含约768 TiB的原始Storage Ceph容量。
Sternagl还补充称,“组织……需要一种能够加快数据摄取、数据清理与分类、元数据管理与增强、以及云规模容量管理及部署速度的存储管理解决方案。而软件定义存储无疑是种重要的解决思路。”此外,新的存储方案还必须能同时支持本地和公有云环境。
他这里指的软件定义存储,自然就是Ceph。IBM肯定不会在自己的发言中推广MinIO、Cloudian、Scality、DataCore或者WekaIO等竞品。
去年12月,IBM发布了Ceph更新,提供用于勒索软件防护的对象锁定不可变功能。新版本还提供对NVMe-oF及NFS的预览版支持,用于将数据摄取至底层Ceph对象存储当中。
评论
要想将块、文件和对象存储实现全面组合,最大的问题就是如何保证各自的访问协议如何彼此对接,这可能会拖累并限制新功能(例如NVMe-oF及NFS支持)的实现。如果大家需要在单一软件包之内支持全部三种协议,那么Ceph的确是个不错的选择。但必须承认,纯块存储、块加文件存储组合、纯文件组合或者对象加文件存储组合其实可以更好地支持新功能,同时带来更高的数据访问速度。
好文章,需要你的鼓励
在“PEC 2025 AI创新者大会暨第二届提示工程峰会”上,一场以“AIGC创作新范式——双脑智能时代:心智驱动的生产力变革”为主题的分论坛,成为现场最具张力的对话空间。
人民大学团队开发了Search-o1框架,让AI在推理时能像侦探一样边查资料边思考。系统通过检测不确定性词汇自动触发搜索,并用知识精炼模块从海量资料中提取关键信息无缝融入推理过程。在博士级科学问题测试中,该系统整体准确率达63.6%,在物理和生物领域甚至超越人类专家水平,为AI推理能力带来突破性提升。
Linux Mint团队计划加快发布周期,在未来几个月推出两个新版本。LMDE 7代号"Gigi"基于Debian 13开发,将包含libAdapta库以支持Gtk4应用的主题功能。新版本将停止提供32位版本支持。同时Cinnamon桌面的Wayland支持持续改进,在菜单、状态小程序和键盘输入处理方面表现更佳,有望成为完整支持Wayland的重要桌面环境之一。
Anthropic研究团队开发的REINFORCE++算法通过采用全局优势标准化解决了AI训练中的"过度拟合"问题。该算法摒弃了传统PPO方法中昂贵的价值网络组件,用统一评价标准替代针对单个问题的局部基准,有效避免了"奖励破解"现象。实验显示,REINFORCE++在处理新问题时表现更稳定,特别是在长文本推理和工具集成场景中展现出优异的泛化能力,为开发更实用可靠的AI系统提供了新思路。