Qumulo 推出了 Cloud Data Fabric (CDF),这是一个具有边缘一致性缓存的中央文件和对象数据核心存储库。
横向扩展文件系统供应商 Qumulo 将其本地部署和公共云软件统一整合到 CDF 中,包括一个可在大多数系统、供应商或公共云基础设施上运行的数据核心分布式文件和对象数据存储集群。用户可以通过边缘的一致性缓存站点访问该系统,这些站点与数据核心的各个元素并行连接。核心和边缘站点之间的严格一致性来自文件系统感知、块级复制、分布式锁定、访问控制认证和日志记录。
Qumulo 总裁兼首席执行官 Douglas Gourlay 表示:"2012 年,Qumulo 开始着手打造世界上最先进的文件系统...从数据中心到云端,摆脱传统限制,我们设想了一个万物皆可用、无处不在、即时可得的未来。"
"我们的客户现在可以做一些神奇而令人惊叹的事情 - 从将全球艺术家和故事讲述者聚集在一起制作电影,到与顶尖医生分享前沿医学研究,再到收集自动驾驶车队的数据,让道路更加安全。"
核心全局文件系统可处理所有数据 - 无论是在公共云还是本地数据中心 - 作为大型弹性池运作,支持分层存储管理、分层和复制,而不影响用户访问或数据位置。这"使应用程序和数据能够独立扩展和移动,支持无缝增长和演进。"
结合严格一致的边缘站点,这允许"使用多样化工具和应用程序进行协作。"
Qumulo 表示,他们拥有超过 1,000 个生产客户,管理着数以 EB 计的数据。联合创始人兼首席架构师 Aaron Passey 说:"过去的文件系统并不是为今天的工作流程和快速数据增长而建造的。我们让用户摆脱专有硬件和操作系统的束缚,允许选择和灵活性,实现无限创新 - Qumulo 用户现在可以使用来自任何来源、在任何基础设施上的数据进行突破性开发。"
Qumulo 的 Cloud Data Fabric 通过主要 IT 基础设施经销商和系统供应商(包括 HPE 和 Supermicro)、分销商以及大多数主要公共云提供商在全球范围内提供,具有预付费和按需付费选项。定价基于数据核心中实际存储和共享的数据。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。