希捷日前宣布发布Apache Hadoop on Lustre连接器的相关资料,以兑现其一直以来支持开源社区的承诺。Hadoop on Lustre连接器能提高工作流效率,运行Apache Hadoop任务之前无需将数据复制到Hadoop分布式文件系统(HDFS)。Hadoop on Lustre连接器还为Hadoop对分布式文件系统(HDFS)的依赖性提供了替代方法,让Hadoop系统工具如Mahout、Hive、Pig等也可利用Lustre文件系统。希捷还发布了源代码作为Hadoop的补丁,允许Map 和 Reduce程序共享文件,并启用“无磁盘”Hadoop计算集群,让Hadoop与使用Lustre进行存储的高性能计算(HPC)架构共同运行。在生命科学和能源领域,越来越多的高性能计算(HPC)客户同时将Hadoop 和 Lustre作为数据分析工作流的一部分。Hadoop on Lustre连接器帮助HPC客户简化Hadoop工作流,缩短展现成效的时间。
希捷同时还公布一项协议,将Lustre.org的相关资产转让至开放式可扩展文件系统(OpenSFS)和欧洲开放式文件系统SCE(EOFS)。OpenSFS和EOFS是Lustre分布式文件软件领域的委托管理组织,将携手管理Lustre.org。希捷通过对OpenSFS给予最高“促进者”级别的资金支持并成为活跃的董事成员,兑现其对Lustre的承诺。希捷深度参与OpenSFS和EOFS的各项工作,成为Lustre代码树最大的代码贡献者之一。
希捷云系统和解决方案部门ClusterStor业务副总裁Ken Claffey 表示:“希捷相信,直接参与能够提升核心能力并培养新的应用环境,这对于开源社区尤其是Lustre的发展至关重要。Lustre是科学、政府以及商界领袖获得高性能计算成就的基础。我们与OpenStack Swift、开源计算项目(OCP)、OpenSFS、EOFS以及目前Hadoop的合作仅仅是一个开始,我们将与开源社区通力合作,致力于推动开源创新并研发出整个业界所倚重的尖端科技。”
这是继希捷于今年一月份公布向开源计算项目(OCP)开放以太网硬盘接口规格以及T-Card开发适配器后的又一举措。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。