解读NVMe高性能低延迟的原因

在上一篇《NVMe的目标：释放闪存潜能》对NVMe的规范发展以及标准化给PCIe闪存市场带来的一些好处做了介绍，这篇文章则进一步讨论下NVMe和PCIe搭配打造的PCIe闪存卡在性能上具有优势的主要因素。

在上一篇《NVMe的目标：释放闪存潜能》对NVMe的规范发展以及标准化给PCIe闪存市场带来的一些好处做了介绍，这篇文章则进一步讨论下NVMe和PCIe搭配打造的PCIe闪存卡在性能上具有优势的主要因素。

最新的SATA接口带宽理论值为6Gbps(750MB/s)，最新的SAS接口带宽为12Gbps，而PCIe每个通路支持1GB/s（PCIe Gen3 x1），并且拥有更好的可扩展性和更低的延迟（即将发布的PBlaze4 PCIe闪存卡可以做到4.0/2.5GB的读/写性能）。这样一个简单的对比说明若要闪存的性能优势充分发挥，PCIe接口是必须的。而NVMe则是将PCIe与闪存以及PCIe闪存卡与主机能够更好的协作。

上图简单展示了几种硬盘/闪存卡的延迟以及指令的路径，简单的说，PCIe从硬件接口的层面缩短了闪存与CPU之间的距离，响应延迟得到了缩短，而NVMe则通过优化从软件层面缩短了指令从CPU到SSD的路径。PCIe、闪存与NVMe 三者的结合像是将接口、存储介质以及接口的协议标准都重新定义了一次，形成了新的存储设备标准。

上图是一张AHCI与NVMe对比的图，信息来自www.sata-io.org的一篇名为《A Comparison of NVMe and AHCI》的文档，当下这幅图被广泛用于各种介绍NVMe优势的演讲中。

这里对上图所列的主要对比项及结果做以说明。首先是最大的队列深度。AHCI最大队列深度为32，而NVMe可以支持64k个队列，同时每个队列深度最大为64k。一个磁盘的IOPS只能做到数百（即便是15000转高速磁盘也是这个量级），而一张PCIe闪存卡可以轻松达到数十万IOPS的性能，可以看出，NVMe做了足够长远的考虑，在队列数和深度上已经超越了AHCI数个数量级。支持更大的队列深度和更多的队列数意味着存储设备的性能不会在接口上遇到瓶颈。

第二是无缓存命中时所需要消耗的时钟周期（每2000个时钟周期为1个单位），由于NVMe并没有读取不可缓存寄存器的操作，所以这里会比AHCI减少一部分缓存寄存器的环节，不同的情况可以节省4到7次寄存器操作；第三是MXI-X和中断管理，这项功能只存在于NVMe中，他能够确保多个CPU核心来处理IO中断；第四项是并行&多线程。NVMe对充分对多核优化，减少了各个CPU核之间的锁同步操作；第五是4K指令的效率。AHCI命令参数需要两个连续的主机DRAM读取操作，NVMe的命令参数则存在单个64B中。

从上述的介绍中，可以看到NVMe联盟眼光考虑的非常长远，NVMe被打造成了未来十年都不会落后的非易失性存储接口标准，他摒弃了很多以往存储接口转为磁盘做的设计，并针对固态存储的特点作了很多优化。值得一提的是NVMe并非只为闪存设计，也将适用于后续的各种非易失存储介质。不仅是针对AHCI这样的接口标准，NVMe有非常多的优势，对于其他的接口标准，也有一定的优势。上图来自IDF2013的一个演讲文档，上图对比了某企业级SSD以及NVMe SSD的效率和功耗。

这个对比尝试说明两个问题，首先是NVMe原型提供更低的单I/O时钟，而同时提供更高的负载性能；其次更低的单I/O时钟间接反映了效率和低功耗（CPU和系统能更快的进入休眠状态）。需要指出的是这个对比在disk端中企业级PCIe SSD应该是闪存，而NVMe SSD则使用了内存，但是用于说明NVMe具有更少的主机CPU占用还是很合适的。

NVMe作为一个为非易失性存储介质而生的接口规范，在性能、端到端数据保护、命令的执行效率等方面都做了长远的考量。加上包括Intel、Memblaze、Redhat、DELL、等众多数据中心不同环节上的厂商支持，可以说整个产业环境都是对NVMe发展非常有利的。为了将PCIe闪存产品做的更加容易维护，SFF-8639接口出现，并被越来越多的服务器厂商支持。在下篇文章中，将对SFF-8639以及其热插拔的特点进行一个详细的介绍。

来源：业界供稿

0赞

好文章，需要你的鼓励

推荐文章

人工智能是否存在泡沫风险的深度分析

人工智能

投资分析

市场预测

2025-11-28

人工智能是否存在泡沫风险的深度分析

当前AI市场呈现分化观点：部分人士担心存在投资泡沫，认为大规模AI投资不可持续；另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元，主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观，认为智能代理AI将带来革命性变化。瑞银分析师指出，从计算需求角度看，AI发展仍处于早期阶段，预计2030年所需算力将达到2万exaflops。

UC伯克利大学发布革命性AI预算验证法：同样成本下数学解题准确率提升15.3%

人工智能

测试时扩展

预算优化

2025-11-28

UC伯克利大学发布革命性AI预算验证法：同样成本下数学解题准确率提升15.3%

加州大学伯克利分校等机构研究团队发布突破性AI验证技术，在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证，采用快速判别式验证结合智能混合策略，将验证成本从数千秒降至秒级，同时保持更高准确性。研究证明在资源受限的现实场景中，简单高效的方法往往优于复杂昂贵的方案，为AI系统的实用化部署提供了重要参考。

AI系统在压力下学会战略性欺骗的深层原因

人工智能

战略性欺骗

优化算法

2025-11-28

AI系统在压力下学会战略性欺骗的深层原因

最新研究显示，先进的大语言模型在面临压力时会策略性地欺骗用户，这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理，在高压环境下，该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷，类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。

香港中文大学突破：让AI像真正的工程师一样设计机器

人工智能

机器设计

强化学习

2025-11-28

香港中文大学突破：让AI像真正的工程师一样设计机器

香港中文大学研究团队开发了BesiegeField环境，让AI学习像工程师一样设计机器。通过汽车和投石机设计测试，发现Gemini 2.5 Pro等先进AI能创建功能性机器，但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力，为未来自动化机器设计系统奠定了基础。

2015

06/11

18:50

分享

点赞

最新文章

相关文章

邮件订阅

白皮书

更多

数字化转型方略

更多

AI启示录

更多

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

- 关注官方公众号
- 关注官方微博
- 关注官方喜马拉雅

业界热点:

数字化转型

北京第二十六维信息技术有限公司（至顶网）版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号京网文(2025) 0096-033号京字第20868号

举报电话：010-62641205　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn　公开举报受理处置规则

网上有害信息举报专区：https://www.12377.cn

安全联盟认证