最新的以太网和融合网络适配器(Converged Network Adapter,CNA)OneConnect OCe14000具备了一些十分重要的性能和数据中心的高效率。OCe14000系列适配器的设计目标是通过满足数据中心、Web规模计算和不断进化的云网络的需求,进一步提升前三代适配器的已有功能。我们相信,我们一定能够实现这些目标,并且设立一些极其创新的性能基准。
与前几代适配器相比数据包处理性能提高4倍
若要在任何情况下提高网络接口卡(Network Interface Card,NIC)的性能,必须要体现一个特征,即能够处理高速率的传入/传出以太网数据包。这一速度通常称为帧速率或数据包速率,并以每秒可传输的数据量来表示,因此通常使用的术语为每秒帧数(Frames Per Second,FPS)或每秒数据包数(Packets Per Second,PPS)。这一点非常重要,原因如下:
首先,如果进入接收器的帧数超出了NIC能够处理的量,则NIC会直接丢弃多余的帧。有一些应用开放时段或高级协议方法可用于处理被丢弃的帧,但所有方法都不如一开始就避免丢弃帧的做法理想。为此我们设计了OCe14000系列产品,它们的帧速率是之前OCe11100系列产品的4倍。不是说OCe11100系列产品不够优秀,实际上,它的帧速率比当前市场上具有硬件存储卸载功能的任何其他适配器都要高。1999年,相关公司制定了一种行业标准测试程序,并以IETF as RFC2544为名称发布,是为了在测试以太网设备的帧速率时提供指导,以确保测试的公平性。我们将把该测试指导原则应用到网络负载生成器,通过一台设备以各种帧大小来测量吞吐量。负载生成器会不断增加负载,直到设备无法返回发送给它的所有帧为止。这种负载水平即为帧速率,通过计算帧大小和帧速率,我们能够以万兆以太网(10GbE)线速率百分比的形式来测量“不丢弃”速率。
每秒最多150万次I/O操作(IOPS)的块存储I/O性能
OCe14102支持iSCSI和以太网上光纤通道(Fibre Channel over Ethernet,FCoE)的硬件卸载和加速块协议,可实现最高150万次IOPS的交易处理性能。虽然150万次IOPS听起来很大,并且几乎是前一代OCe11102 CNA的两倍,但实际情况并非如此。因为网络和存储适配器就像是赛车,要想迅速加速,就必须拥有巨大的马力。以512数据字节块大小实现150万次IOPS是我们适配器拥有较大“马力”的指标,但我们的最终目标是以高性能应用所需的数据块大小尽可能多地执行10GbE链路带宽允许的交易。起始块大小通常为4k或更大。因此,如果说适配器需要具有能够以4k块大小达到线速率带宽的处理能力,就好比赛车需要具有一个能够在高速公路上迅速加速到最高速度的引擎。而150万次IOPS的要求则可以看作是汽车加速赛上硝烟四起的横冲直撞。在10GbE中,FCoE的最大链路带宽约为1150兆/秒。OCe14102的一个端口几乎能够以2k数据块大小实现链路带宽限制,并且能够以4k和更高数据块大小稳定实现这一点。这点非常关键,因为一旦数据吞吐量达到链路带宽,除非增加其他端口,否则就无法实现更大的IOPS;而且,Oracle RDBMS、SQL Server、MS Exchange及其他高交易数据应用均需要以4k和更高的数据块大小实现较高的IOPS。
降低服务器功耗
对于标准的双插槽机架优化服务器,OCe14102的硬件卸载技术可帮助将服务器功耗最多减少50瓦。在执行I/O性能基准的同时,这一声明把在交流插座上进行测量时所做的服务器功耗比较作为基础。现代多核服务器的设计旨在提高电源效率,并采用各种技术和配置文件来节省电源消耗,为了在活动性较低时减少功耗,并在高峰负载时刻持续提高性能。对于每种新一代产品,这些服务器均面临市场压力。通过在各种活动级别中使用一个简单的交流功率测量工具对服务器进行监控,可以轻松验证这些降低服务器功耗策略的有效性。I/O操作数可能会对服务器利用率以及功耗产生重大影响,具体取决于在操作系统内执行的I/O高级协议工作。OCe14000系列适配器采用了大量节能策略,包括能够将服务器的大多数协议处理工作卸载给适配器的内部处理器、允许服务器的处理器仍然处于低功耗状态——即使在通过适配器处理极高的I/O时也是如此。而不具备用于iSCSI和FCoE的硬件卸载功能,或在软件中处理重叠网络封装(失去了其他适配器卸载功能)的适配器的服务器功效则相对更低;而且,在同等工作负载下,服务器将消耗更多电量。通过执行高性能I/O来提高服务器功效,而不会导致服务器消耗更多电量,这是适配器应当实现的目标。此外,我们的硬件加速iSCSI功能、NIC虚拟可扩展LAN(VXLAN)以及使用通用路由封装(NVGRE)功能的网络虚拟化均可提高服务器功效。
使用下一代的任何产品,用户均有望获得比以往更高的性能。使用OCe14000系列适配器后,可以看出,我们已经做出了一些重大改进。我们的性能和效率有了明显改善,同时还添加了新的功能,其中一些功能仍有待推出。
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。