PeerGFS 最新版本现可同时通过 SMB 和 NFS 协议访问同一文件。
PeerGFS ( GFS stands for Global File Service ) 提供数据中心、公有云和边缘位置间文件卷的实时、主动复制。它采用多主模式,基于这样的理念:分布式组织的文件应视为动态实体而非固定位置的静态数据,其真是数据源会根据需要不断更新和分发。此前,该 Peer 软件在访问不同的文件时已支持 SMB 和 NFS 文件协议,而现在,它能够在多个存储系统及跨地域环境中同时为同一文件卷提供 SMB 和 NFS 访问。
PeerGFS 首席执行官 Jimmy Tam 表示: “多协议支持打破了长期以来迫使 IT 团队为不同的应用或环境创建冗余数据副本的壁垒。无论是在边缘通过 SMB 采集数据,还是在核心或云端使用基于 NFS 的存储由 AI 引擎进行数据分析,PeerGFS 都能确保数据集唯一、同步且可访问。”
最新的 v6.20 版本为 PeerGFS 增加了对 Amazon FSxN、Dell PowerScale、NetApp ONTAP 和 Nutanix Files 的支持,并在现有 Windows 服务器和多供应商文件存储阵列支持的基础上,为 Linux 文件服务器(内核 5.9 及以上)提供支持。同时还提升了边缘位置的数据管理和存储优化,并增加了对 PostgreSQL 的支持。
该版本为其恶意事件检测 ( MED ) 功能增加了签名校验功能,并支持在任务运行时更新部分 MED 配置。
Peer 表示,同时多协议支持对于 AI 工作流来说“尤其具有重大意义,因为数据通常在边缘通过 SMB 采集,而在中枢则由通常要求使用 NFS 的 Linux 工具进行处理。”
另一个应用案例是一家医疗机构,在当地医院通过基于 SMB 的存储采集患者 MRI 扫描数据,并自动将该数据同步至基于 NFS 的集中存储中,供 AI 分析使用。如今,再也不需要冗余的卷或手动数据传输。Peer 声称,这将有助于缩短诊断等待时间。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。