5月31日,网络互联芯片提供商云脉芯联正式发布自主研发的国内首款多场景RDMA智能网卡(DPU)产品——xFusion50。
目前,随着数字经济的飞速发展,数据中心已成为支撑和释放CPU算力的重要基础设施,承载着各类数字技术的应用。高性能网络作为数据中心的算力底座,在数据中心架构演进过程中扮演着重要角色,随着摩尔定律放缓,多样性异构算力的崛起,如何通过降低网络延迟提升数据中心集群算力性能指标,满足Serverless云原生算力需求,面临着诸多技术挑战,如:
l TCP/IP网络协议栈导致收发报文时延过大,无法满足当下HPC、AI计算和分布式存储的高性能需求,同时TCP协议栈处理导致CPU负载高居不下;
l 随着网络带宽的倍增和集群规模的扩大,网络拥塞问题日益突出,确保网络无损难度加大,网络0.1%的丢包率将导致上层应用算力性能只能发挥50%;
l RDMA网络技术已是大势所趋,但在进一步普及过程中缺乏兼容互通,灵活开放的端到端方案,造成在数据中心大规模高效部署RDMA网络有很高的技术门槛。
xFusion50是云脉芯联成功自主研发的第一款产品,也是国内首款实现包括支持端到端拥塞控制完整RDMA功能的DPU产品,xFusion50基于硬件实现的可编程拥塞控制算法能够有效避免网络拥塞,充分发挥RDMA技术的低延迟和高性能,支持云计算、高性能计算、AI、存储集群全场景部署。
云脉芯联创始人&总裁吴吉朋表示:“云脉芯联自去年5月成立以来,坚持以‘专注用户,引领创芯’为核心理念,在产品研发上以用户需求为导向不断砥砺创新。xFusion50的成功面市可有效帮助用户降低部署RDMA网络的技术门槛,实现高带宽、低延迟的高性能集群组网,全面提升算力集群整体效能。为不断满足用户对多场景算力卸载和高性能网络的需求,云脉芯联下一代高性能DPU芯片的研发也在有序进行中,不久即将面世,敬请期待。”
xFusion50产品核心亮点
l 支持可编程拥塞控制算法
可编程拥塞控制算法是实现端到端无损网络的关键技术,xFusion50不仅能支持业界主流的拥塞控制算法,还可以通过开放可编程的底层网络接口,可根据客户的组网特点和上层业务的需求,灵活支持多种拥塞控制算法,最大化业务的流量吞吐。
l 通过自主研发HyperDirect技术支持GPU Direct RDMA
为跨计算节点的GPU实现远程内存直接访问,跳过CPU以降低时延、提升带宽,提升分布式异构算力集群的整体效能。
l 支持网络/存储全场景卸载加速
支持vSwitch全卸载,实现云上VPC网络全功能;支持存储卸载,对接分布式存储NVMe-oF(TCP/RDMA),充分释放宿主机CPU资源。并通过支持VirtIO实现弹性网络和弹性存储,满足云上用户无缝迁移和快速恢复的业务诉求。
xFusion50产品适用场景及解决方案
高性能集群场景
AI、HPC、分布式存储等高性能集群场景中,对节点间的数据处理与通信有着低时延和高吞吐的诉求,xFusion50支持基于以太网的RDMA组网和可编程拥塞控制算法,实现高性能场景对低时延和高吞吐的需求,并配合云脉芯联提供的xsc-easy-bench可大幅提升业务上线调试效率。
云计算场景
传统云计算架构基于CPU的软件虚拟化技术提供IaaS业务,大量CPU资源被用于处理与租户业务无关的hypervisor层,租户与云hypervisor共享CPU,租户业务容易被管理业务影响,造成抖动。xFusion50为云计算场景提供了一种基于裸金属云的基础设施架构,将hypervisor层卸载到xFusion50上,可满足虚拟机、裸金属、容器多种云上资源供给,并提供网络/存储加速功能,兼顾灵活性与高性能。
关于云脉芯联
云脉芯联创立于2021年5月,是一家专注于云数据中心网络芯片产品研发与技术创新的高科技创新企业。公司以“构建数字世界的互联底座”为发展愿景,致力于打造用于大规模数据中心和云计算基础设施的网络互联芯片,帮助用户构建端网融合的高性能网络基础设施,以应对进入全面数字化和智能化时代的技术挑战。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。