Emulex与IBTA为数据中心推出横向RoCEv2

近日，Emulex联合InfiniBand行业协会（InfiniBand Trade Association，IBTA），共同宣布推出了增强RoCE（RDMA over Converged Ethernet）规范，该规范将被称为“RoCEv2”。

RoCEv2在现有RoCE规范中添加的主要提升功能叫做可布线性（Routability），该功能可突破2层网络边界，并帮助企业通过RoCE在数据中心的任何位置实现应用加速。利用这项创新，数据中心可以将RoCE的价值扩展到多个域和物理位置。

RDMA允许在两台服务器的内存之间直接转移数据，而无需任何一台服务器的CPU参与（也称为零拷贝网络），因此可实现更高效的通信。这种处理在支持RDMA的网络接口卡（Network Interface Card，NIC）上进行，并且会避开TCP/IP堆栈，因而加快数据转移。如此，就可以直接将数据传送到目标服务器上的远程内存中，降低用于其他处理的服务器的CPU I/O工作负载。

虽然RDMA最初是InfiniBand网络的一项功能，但许多年来，人们一直设法使以太网能够支持RoCE。2010年推出的初始RoCE规范在以太网上实现了RDMA功能，但它却需要无损网络，这限制了该功能的应用范围。目前，RoCE的主要用途之一是在Windows Server 2012上通过服务器消息块（SMB）Direct实现高性能数据传输；同时，各种版本的Linux也支持该功能。RoCE的主要优势在于：由于它的延迟较低，因此可提高网络利用率；同时它可避开TCP/IP并采用硬件卸载，因此CPU利用率也较低。此外，由于可以在单一线路上将服务器上的其他协议融合到网络中，RoCE还进一步深化了线缆整合的概念。

但是，随着虚拟化、云计算和分散式大数据存储库的持续增长，数据加速能力已经成为全球数据中心共同面临的问题，而不是仅局限于单一2层网络的局部问题。利用可布线性，RoCEv2可填补这一差距，并跟上传统本地化数据中心功能在整个数据中心内的扩张步伐。为了实现上述目标，RoCEv2规范将用以太网链路层上的IP报头和UDP报头替代InfiniBand网络层。这样，就可以在基于IP的传统路由器之间路由RoCE。下面的图1和图2显示了协议堆栈比较和帧格式。