X86服务器发展到今天,各类平台产品既有通用性,又具独特性。设计过程中为了满足不同的需求往往会对一些因素做出取舍和平衡。增加服务器存储密度则意味着牺牲计算资源或扩展性;增加计算资源又不得不降低服务器存储密度。如何平衡服务器在计算性能与存储密度之间的关系,日益成为用户关注的焦点。
在前不久召开的全球最大的虚拟主机和云服务行业大会HostingCon上,浪潮发布了一款具有超高存储密度服务器--NF5166M4。这款服务器在1U的紧凑空间里可支持120T硬盘,专为分级存储架构优化,同时具备强劲计算能力,解决了在服务器内部有限的空间内计算性能与存储密度之间一度紧张和互斥的关系。
今天就让我们一起来解读一下这台有着独特魅力的浪潮服务器:

图1:NF5166M4前俯视图
120T超大存储空间
NF5166M4是一款高密度的1U双路机架服务器。在紧凑空间内支持12块3.5寸热插拔硬盘和4个2.5寸热插拔SATA SSD,最大数据存储空间达120T,存储密度是传统1U服务器的3倍,相同存储容量下可节约50%机房空间。
混合存储架构
12个3.5寸硬盘和4个2.5寸SSD组成的混合存储架构,实现了数据盘与缓存盘4:1或3:1的最佳性能比,帮助客户从海量的数据资源中,将热点数据与冷数据区分对待并存储到不同的硬盘区间,从而提升服务器存储的使用效率、优化服务器整体的投入产出比,达到优化存储成本的目的。

图2:NF5166M4内部前俯视图
强劲计算性能
在提供了超大存储空间和精密的分级存储混合架构的同时,NF5166M4也具备同样强劲的计算性能。支持2颗Intel Xeon E5-2600v4处理器,较前一代的处理器性能提升超过40%; 支持16条DDR4-2400内存,具备卓越的计算性能,满足对计算性能要求较高的存储应用需求。

图3:NF5166M4内部后俯视图
兼顾密度与性能
要在空间要求极其苛刻的1U机架式中放入12块3.5" HDD+4块2,5" SSD,同时还不能牺牲计算性能,如此不能完成的任务究竟是如何做到的?
在NF5166M4的设计方案研讨中,浪潮工程师们在对行业客户的使用习惯以及客户应用深入研究后发现:在Intel 至强? E5-2600系列CPU平台应用中90%以上的客户不会将全部的24个DIMM全部用满,浪潮服务器的专家们利用这一点要素将DIMM数量从24个降低到16个。这样一来既缩减了主板占用空间、减小了主板大小,又可以满足90%以上客户的计算需求。
高效节能
部署极致的存储和计算性能后可以带来更高的效率,从而帮助数据中心实现节省成本、占地空间等难题。但在这种情况下还需要权衡的问题:会不会对机箱的散热造成影响,从而影响功耗?
NF5166M4设计中采用了5+1的高效数字电源方案,通过系统环境动态感知技术实时调节风扇转速,配合先进的风冷系统,可实时监控整机能耗。同时,采用2个700W白金级高效冗余电源模块,为整机的稳定运行保驾护航。
同时,NF5166M4采用业内最优的高效数字电源方案,转化效率高达94%,通过系统环境动态感知技术实时调节风扇转速,可实时监控整机能耗,配合先进的风冷系统,真正实现绿色节能理念。
灵活扩展
在扩展性方面,NF5166M4后面板的I/O接口布局也十分丰富,2个USB 3.0接口、1个VGA接口,1个串口,便于运维时的外设接入。在网络接口方面,主机集成2个千兆网口,支持虚拟化加速、网络加速、负载均衡、冗余等高级功能。可选配置1个网络子卡选项,支持外插万兆网卡,为客户的万兆网络接入提供必要的可选条件。

图4:NF5166M4后俯视图
适用于分布式文件系统应用
在应用方面,除了传统的企业级应用之外、NF5166M4还特别适用于分布式文件系统(DFS)这类当下热门的系统应用,如比较主流的分布式文件系统包括: Hadoop、Lustre、FreeNAS、FastDFS、NFS、OpenAFS以及GoogleFS等等。这些应用中的数据服务器(ChunkServer/DataNode)需要用几十台甚至上百台的性价比高、存储空间大而又不失计算性能高的x86服务器机群组成。NF5166M4出色的性能和高密度的存储空间,恰好满足了这一类型服务器的应用需要。

图5:NF5166M4内部俯视图
近年来,随着我国互联网、云计算和大数据产业的加速发展,数据中心规模越来越大,随之带来了服务器数量的激增,服务器设计在追求计算性能的同时更多地转向追求高密度、海量存储等特性。NF5166M4作为一款拥有超高密度以及优秀的计算性能的1U机架式服务器,在高效负载客业务应用的同时可为用户带来更优化的IT设备投入产出比。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。