12月22日,由中国计算机学会(CCF)信息存储专委会主编,天翼云、中国电子云、中科驭数、华为等十余家企业联合撰写的《数据中心Diskless架构》白皮书正式发布。白皮书系统阐述了Diskless架构产生的背景,详细介绍了Diskless架构的组成部分、关键技术,以及在典型行业的应用场景,并展望了未来的发展机遇。
中国工程院院士郑纬民表示:“《数据中心Diskless架构》白皮书系统地梳理了数据中心架构转型的背景和挑战,提出了一种新的数据中心架构模式——数据中心Diskless架构。我相信这是一次非常有意义的探索,这份研究对于相关决策部门、企业界、学术界具有很好的启示和参考意义。”
传统数据中心体系架构是典型的多级分层架构,从服务器到网络到存储,每一层都独立围绕CPU、内存、总线、硬盘等组件构成的完整计算机系统。当新的数据应用出现的时候,为了快速部署新业务,企业通常采用最简单的应用与本地盘耦合的服务器一体化架构。然而,计算、存储等硬件资源发展速度不均衡,算力生命周期和数据生命周期的差异越来越大,导致传统IT架构存在的扩展不灵活、资源闲置、利用率低下等问题显现。此外,该架构也无法满足业务数据共享访问的需求。
在新业务挑战、硬件技术快速发展等多重因素驱动下,Diskless架构迅速兴起。Diskless架构将服务器本地盘拉远,构成Diskless的服务器和远端存储池,将原有架构的多级分层资源彻底解耦池化和重组整合,真正实现各类硬件的独立扩展及灵活共享。此外,Diskless架构突破了传统以通用CPU为中心的处理逻辑,使数据处理等CPU不擅长的任务被专用加速器、DPU等替代,实现能效比最优的硬件组合。
白皮书中指出:面向云和互联网行业,Diskless架构在虚拟化、数据库、大数据、容器等场景加速资源池化共享,提升了资源利用率、可靠性及扩展性,帮助企业降本增效、快速迭代;面向高性能计算HPC场景,Diskless架构实现了资源的按需分配和扩展,进一步提升了系统资源使用效率,同时还可以隔离故障,提升系统可靠性。
构建数据中心Diskless架构,目前仍面临技术、生态方面的挑战,一些领域还处于探索阶段。如何与现有生态应用进行结合与上层应用协同,需要产业界、学术界专家共同探索解决。当前,天翼云、中国电子云、中科驭数、华为、大普微等企业已积极投入到Diskless架构的实践中。
中国计算机学会(CCF)信息存储技术专委会主任舒继武表示:“未来,Diskless架构将凭借其灵活的架构、精细化的资源利用率、绿色低碳的能耗比等优势,帮助数据中心破解算力浪费、绿色集约的难题,迎来数据中心产业变革的新机会。”
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。