5月31日,网络互联芯片提供商云脉芯联正式发布自主研发的国内首款多场景RDMA智能网卡(DPU)产品——xFusion50。
目前,随着数字经济的飞速发展,数据中心已成为支撑和释放CPU算力的重要基础设施,承载着各类数字技术的应用。高性能网络作为数据中心的算力底座,在数据中心架构演进过程中扮演着重要角色,随着摩尔定律放缓,多样性异构算力的崛起,如何通过降低网络延迟提升数据中心集群算力性能指标,满足Serverless云原生算力需求,面临着诸多技术挑战,如:
l TCP/IP网络协议栈导致收发报文时延过大,无法满足当下HPC、AI计算和分布式存储的高性能需求,同时TCP协议栈处理导致CPU负载高居不下;
l 随着网络带宽的倍增和集群规模的扩大,网络拥塞问题日益突出,确保网络无损难度加大,网络0.1%的丢包率将导致上层应用算力性能只能发挥50%;
l RDMA网络技术已是大势所趋,但在进一步普及过程中缺乏兼容互通,灵活开放的端到端方案,造成在数据中心大规模高效部署RDMA网络有很高的技术门槛。
xFusion50是云脉芯联成功自主研发的第一款产品,也是国内首款实现包括支持端到端拥塞控制完整RDMA功能的DPU产品,xFusion50基于硬件实现的可编程拥塞控制算法能够有效避免网络拥塞,充分发挥RDMA技术的低延迟和高性能,支持云计算、高性能计算、AI、存储集群全场景部署。
云脉芯联创始人&总裁吴吉朋表示:“云脉芯联自去年5月成立以来,坚持以‘专注用户,引领创芯’为核心理念,在产品研发上以用户需求为导向不断砥砺创新。xFusion50的成功面市可有效帮助用户降低部署RDMA网络的技术门槛,实现高带宽、低延迟的高性能集群组网,全面提升算力集群整体效能。为不断满足用户对多场景算力卸载和高性能网络的需求,云脉芯联下一代高性能DPU芯片的研发也在有序进行中,不久即将面世,敬请期待。”
xFusion50产品核心亮点
l 支持可编程拥塞控制算法
可编程拥塞控制算法是实现端到端无损网络的关键技术,xFusion50不仅能支持业界主流的拥塞控制算法,还可以通过开放可编程的底层网络接口,可根据客户的组网特点和上层业务的需求,灵活支持多种拥塞控制算法,最大化业务的流量吞吐。
l 通过自主研发HyperDirect技术支持GPU Direct RDMA
为跨计算节点的GPU实现远程内存直接访问,跳过CPU以降低时延、提升带宽,提升分布式异构算力集群的整体效能。
l 支持网络/存储全场景卸载加速
支持vSwitch全卸载,实现云上VPC网络全功能;支持存储卸载,对接分布式存储NVMe-oF(TCP/RDMA),充分释放宿主机CPU资源。并通过支持VirtIO实现弹性网络和弹性存储,满足云上用户无缝迁移和快速恢复的业务诉求。
xFusion50产品适用场景及解决方案
高性能集群场景
AI、HPC、分布式存储等高性能集群场景中,对节点间的数据处理与通信有着低时延和高吞吐的诉求,xFusion50支持基于以太网的RDMA组网和可编程拥塞控制算法,实现高性能场景对低时延和高吞吐的需求,并配合云脉芯联提供的xsc-easy-bench可大幅提升业务上线调试效率。
云计算场景
传统云计算架构基于CPU的软件虚拟化技术提供IaaS业务,大量CPU资源被用于处理与租户业务无关的hypervisor层,租户与云hypervisor共享CPU,租户业务容易被管理业务影响,造成抖动。xFusion50为云计算场景提供了一种基于裸金属云的基础设施架构,将hypervisor层卸载到xFusion50上,可满足虚拟机、裸金属、容器多种云上资源供给,并提供网络/存储加速功能,兼顾灵活性与高性能。
关于云脉芯联
云脉芯联创立于2021年5月,是一家专注于云数据中心网络芯片产品研发与技术创新的高科技创新企业。公司以“构建数字世界的互联底座”为发展愿景,致力于打造用于大规模数据中心和云计算基础设施的网络互联芯片,帮助用户构建端网融合的高性能网络基础设施,以应对进入全面数字化和智能化时代的技术挑战。
好文章,需要你的鼓励
AI颠覆预计将在2026年持续,推动企业适应不断演进的技术并扩大规模。国际奥委会、Moderna和Sportradar的领导者在纽约路透社峰会上分享了他们的AI策略。讨论焦点包括自建AI与购买第三方资源的选择,AI在内部流程优化和外部产品开发中的应用,以及小型模型在日常应用中的潜力。专家建议,企业应将AI建设融入企业文化,以创新而非成本节约为驱动力。
字节跳动等机构联合发布GAR技术,让AI能同时理解图像的全局和局部信息,实现对多个区域间复杂关系的准确分析。该技术通过RoI对齐特征重放方法,在保持全局视野的同时提取精确细节,在多项测试中表现出色,甚至在某些指标上超越了体积更大的模型,为AI视觉理解能力带来重要突破。
Spotify在新西兰测试推出AI提示播放列表功能,用户可通过文字描述需求让AI根据指令和听歌历史生成个性化播放列表。该功能允许用户设置定期刷新,相当于创建可控制算法的每周发现播放列表。这是Spotify赋予用户更多控制权努力的一部分,此前其AI DJ功能也增加了语音提示选项,反映了各平台让用户更好控制算法推荐的趋势。
Inclusion AI团队推出首个开源万亿参数思维模型Ring-1T,通过IcePop、C3PO++和ASystem三项核心技术突破,解决了超大规模强化学习训练的稳定性和效率难题。该模型在AIME-2025获得93.4分,IMO-2025达到银牌水平,CodeForces获得2088分,展现出卓越的数学推理和编程能力,为AI推理能力发展树立了新的里程碑。