12月22日,由中国计算机学会(CCF)信息存储专委会主编,天翼云、中国电子云、中科驭数、华为等十余家企业联合撰写的《数据中心Diskless架构》白皮书正式发布。白皮书系统阐述了Diskless架构产生的背景,详细介绍了Diskless架构的组成部分、关键技术,以及在典型行业的应用场景,并展望了未来的发展机遇。
中国工程院院士郑纬民表示:“《数据中心Diskless架构》白皮书系统地梳理了数据中心架构转型的背景和挑战,提出了一种新的数据中心架构模式——数据中心Diskless架构。我相信这是一次非常有意义的探索,这份研究对于相关决策部门、企业界、学术界具有很好的启示和参考意义。”
传统数据中心体系架构是典型的多级分层架构,从服务器到网络到存储,每一层都独立围绕CPU、内存、总线、硬盘等组件构成的完整计算机系统。当新的数据应用出现的时候,为了快速部署新业务,企业通常采用最简单的应用与本地盘耦合的服务器一体化架构。然而,计算、存储等硬件资源发展速度不均衡,算力生命周期和数据生命周期的差异越来越大,导致传统IT架构存在的扩展不灵活、资源闲置、利用率低下等问题显现。此外,该架构也无法满足业务数据共享访问的需求。
在新业务挑战、硬件技术快速发展等多重因素驱动下,Diskless架构迅速兴起。Diskless架构将服务器本地盘拉远,构成Diskless的服务器和远端存储池,将原有架构的多级分层资源彻底解耦池化和重组整合,真正实现各类硬件的独立扩展及灵活共享。此外,Diskless架构突破了传统以通用CPU为中心的处理逻辑,使数据处理等CPU不擅长的任务被专用加速器、DPU等替代,实现能效比最优的硬件组合。
白皮书中指出:面向云和互联网行业,Diskless架构在虚拟化、数据库、大数据、容器等场景加速资源池化共享,提升了资源利用率、可靠性及扩展性,帮助企业降本增效、快速迭代;面向高性能计算HPC场景,Diskless架构实现了资源的按需分配和扩展,进一步提升了系统资源使用效率,同时还可以隔离故障,提升系统可靠性。
构建数据中心Diskless架构,目前仍面临技术、生态方面的挑战,一些领域还处于探索阶段。如何与现有生态应用进行结合与上层应用协同,需要产业界、学术界专家共同探索解决。当前,天翼云、中国电子云、中科驭数、华为、大普微等企业已积极投入到Diskless架构的实践中。
中国计算机学会(CCF)信息存储技术专委会主任舒继武表示:“未来,Diskless架构将凭借其灵活的架构、精细化的资源利用率、绿色低碳的能耗比等优势,帮助数据中心破解算力浪费、绿色集约的难题,迎来数据中心产业变革的新机会。”
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。