X86服务器发展到今天,各类平台产品既有通用性,又具独特性。设计过程中为了满足不同的需求往往会对一些因素做出取舍和平衡。增加服务器存储密度则意味着牺牲计算资源或扩展性;增加计算资源又不得不降低服务器存储密度。如何平衡服务器在计算性能与存储密度之间的关系,日益成为用户关注的焦点。
在前不久召开的全球最大的虚拟主机和云服务行业大会HostingCon上,浪潮发布了一款具有超高存储密度服务器--NF5166M4。这款服务器在1U的紧凑空间里可支持120T硬盘,专为分级存储架构优化,同时具备强劲计算能力,解决了在服务器内部有限的空间内计算性能与存储密度之间一度紧张和互斥的关系。
今天就让我们一起来解读一下这台有着独特魅力的浪潮服务器:
图1:NF5166M4前俯视图
120T超大存储空间
NF5166M4是一款高密度的1U双路机架服务器。在紧凑空间内支持12块3.5寸热插拔硬盘和4个2.5寸热插拔SATA SSD,最大数据存储空间达120T,存储密度是传统1U服务器的3倍,相同存储容量下可节约50%机房空间。
混合存储架构
12个3.5寸硬盘和4个2.5寸SSD组成的混合存储架构,实现了数据盘与缓存盘4:1或3:1的最佳性能比,帮助客户从海量的数据资源中,将热点数据与冷数据区分对待并存储到不同的硬盘区间,从而提升服务器存储的使用效率、优化服务器整体的投入产出比,达到优化存储成本的目的。
图2:NF5166M4内部前俯视图
强劲计算性能
在提供了超大存储空间和精密的分级存储混合架构的同时,NF5166M4也具备同样强劲的计算性能。支持2颗Intel Xeon E5-2600v4处理器,较前一代的处理器性能提升超过40%; 支持16条DDR4-2400内存,具备卓越的计算性能,满足对计算性能要求较高的存储应用需求。
图3:NF5166M4内部后俯视图
兼顾密度与性能
要在空间要求极其苛刻的1U机架式中放入12块3.5" HDD+4块2,5" SSD,同时还不能牺牲计算性能,如此不能完成的任务究竟是如何做到的?
在NF5166M4的设计方案研讨中,浪潮工程师们在对行业客户的使用习惯以及客户应用深入研究后发现:在Intel 至强? E5-2600系列CPU平台应用中90%以上的客户不会将全部的24个DIMM全部用满,浪潮服务器的专家们利用这一点要素将DIMM数量从24个降低到16个。这样一来既缩减了主板占用空间、减小了主板大小,又可以满足90%以上客户的计算需求。
高效节能
部署极致的存储和计算性能后可以带来更高的效率,从而帮助数据中心实现节省成本、占地空间等难题。但在这种情况下还需要权衡的问题:会不会对机箱的散热造成影响,从而影响功耗?
NF5166M4设计中采用了5+1的高效数字电源方案,通过系统环境动态感知技术实时调节风扇转速,配合先进的风冷系统,可实时监控整机能耗。同时,采用2个700W白金级高效冗余电源模块,为整机的稳定运行保驾护航。
同时,NF5166M4采用业内最优的高效数字电源方案,转化效率高达94%,通过系统环境动态感知技术实时调节风扇转速,可实时监控整机能耗,配合先进的风冷系统,真正实现绿色节能理念。
灵活扩展
在扩展性方面,NF5166M4后面板的I/O接口布局也十分丰富,2个USB 3.0接口、1个VGA接口,1个串口,便于运维时的外设接入。在网络接口方面,主机集成2个千兆网口,支持虚拟化加速、网络加速、负载均衡、冗余等高级功能。可选配置1个网络子卡选项,支持外插万兆网卡,为客户的万兆网络接入提供必要的可选条件。
图4:NF5166M4后俯视图
适用于分布式文件系统应用
在应用方面,除了传统的企业级应用之外、NF5166M4还特别适用于分布式文件系统(DFS)这类当下热门的系统应用,如比较主流的分布式文件系统包括: Hadoop、Lustre、FreeNAS、FastDFS、NFS、OpenAFS以及GoogleFS等等。这些应用中的数据服务器(ChunkServer/DataNode)需要用几十台甚至上百台的性价比高、存储空间大而又不失计算性能高的x86服务器机群组成。NF5166M4出色的性能和高密度的存储空间,恰好满足了这一类型服务器的应用需要。
图5:NF5166M4内部俯视图
近年来,随着我国互联网、云计算和大数据产业的加速发展,数据中心规模越来越大,随之带来了服务器数量的激增,服务器设计在追求计算性能的同时更多地转向追求高密度、海量存储等特性。NF5166M4作为一款拥有超高密度以及优秀的计算性能的1U机架式服务器,在高效负载客业务应用的同时可为用户带来更优化的IT设备投入产出比。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。