IBM的通用并行文件系统(简称GPFS)将很快经由蓝色巨人的线性磁带文件系统,也就是LTFS的企业级版本,与磁带库中的文件“交会”。
LTFS包含一套自描述性磁带格式,其中保存在介质上已知位置的元数据负责定义磁带中的文件内容。LTFS支持LTO5、LTO6以及TS1140几种磁带格式,而主机设备可以利用LTFS实现面向磁带的拖拽操作以及文件:文件夹图形化用户界面。
尽管GPFS目前已经被划入Elastic Storage品牌之下,但IBM仍然在继续开发一套LTFS EE(即企业版本)产品,旨在为GPFS与LTFS架起对接的桥梁。
IBM公司德国分部客户技术架构师Frank Kraemer表示,用户可以“将任意LTFS磁带纳入这款磁带库,利用LTFS EE命令将内容进行导入,相关数据内容将由对应导入规则加以定义并显示在GPFS文件系统当中。”
之所以能够实现这样的效果,是因为LTFS EE“利用内部‘隐藏’GPFS文件系统以保持LTFS元数据与GPFS之间的映射关系。”
借助这套方案,我们可以将规模庞大、访问频率较低但却必须保留的GPFS数据保存在低成本但却具备出色可靠性的磁带之上,而不必让其占用相对昂贵的磁盘存储空间。
LTFS EE数据导入/导出机制
IBM在LTFS官方网站上作出如下说明:
IBM线性磁带文件系统企业版本(简称LTFS EE)为企业用户提供一套简便方案,旨在以突出的成本效率在分层式存储基础设施当中使用IBM的磁带驱动器与磁带库。那些利用磁带库来取代原本作为二级与三级数据存储(即数据长期保留机制)磁盘设备的企业用户也可以借此提高效率并降低使用成本。除此之外,LTFS EE能够以无缝化方式集成GPFS的可扩展性、可管理性以及性能表现,这套由IBM打造的企业级文件管理平台能够帮助用户摆脱以往单纯添加存储资源的束缚、对数据管理作出优化。
IBM表示“利用LTFS EE,企业用户能够轻松在全局存储环境之内共享针对磁带与磁盘存储内容的访问能力。”
我们必须强调的一点是,“在大型GPFS集群当中,LTFS EE实例的数量最小需要为两套,而如果有必要、大家也可以将其扩展到全部GPFS NSD服务器节点当中。”
蓝色巨人指出,用户可以通过LTFS EE或者GPFS策略对同一套站点内的磁带资源进行双重管理。如果需要具备多站点电子副本功能,那么同时采用两套实施方案也是完全可行的。GPFS AFM能够被用于在两套站点之间进行数据复制,或者利用一套简单脚本实现重新同步、从而完成此类复制任务。
IBM指出,“磁带驱动器以及LTFS EE服务器的性能表现可借助LTFS EE软件实现负载平衡,从而确保数据传输速度与数据可用性始终保持在最高水平。”
LTFS EE目前支持的磁带库分别为采用LTO 5、LTO 6以及IBM 3592 JB、JC以及JK格式的IBM TS4500与TS3500库。用户必须使用GPFS v3.4及其后续版本。
Kraemer补充称:“这是一款新兴产品,但客户对其保持着高度关注,而且早期体验者已经开始了自己的试用之旅。”
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。