5月31日,网络互联芯片提供商云脉芯联正式发布自主研发的国内首款多场景RDMA智能网卡(DPU)产品——xFusion50。
目前,随着数字经济的飞速发展,数据中心已成为支撑和释放CPU算力的重要基础设施,承载着各类数字技术的应用。高性能网络作为数据中心的算力底座,在数据中心架构演进过程中扮演着重要角色,随着摩尔定律放缓,多样性异构算力的崛起,如何通过降低网络延迟提升数据中心集群算力性能指标,满足Serverless云原生算力需求,面临着诸多技术挑战,如:
l TCP/IP网络协议栈导致收发报文时延过大,无法满足当下HPC、AI计算和分布式存储的高性能需求,同时TCP协议栈处理导致CPU负载高居不下;
l 随着网络带宽的倍增和集群规模的扩大,网络拥塞问题日益突出,确保网络无损难度加大,网络0.1%的丢包率将导致上层应用算力性能只能发挥50%;
l RDMA网络技术已是大势所趋,但在进一步普及过程中缺乏兼容互通,灵活开放的端到端方案,造成在数据中心大规模高效部署RDMA网络有很高的技术门槛。
xFusion50是云脉芯联成功自主研发的第一款产品,也是国内首款实现包括支持端到端拥塞控制完整RDMA功能的DPU产品,xFusion50基于硬件实现的可编程拥塞控制算法能够有效避免网络拥塞,充分发挥RDMA技术的低延迟和高性能,支持云计算、高性能计算、AI、存储集群全场景部署。
云脉芯联创始人&总裁吴吉朋表示:“云脉芯联自去年5月成立以来,坚持以‘专注用户,引领创芯’为核心理念,在产品研发上以用户需求为导向不断砥砺创新。xFusion50的成功面市可有效帮助用户降低部署RDMA网络的技术门槛,实现高带宽、低延迟的高性能集群组网,全面提升算力集群整体效能。为不断满足用户对多场景算力卸载和高性能网络的需求,云脉芯联下一代高性能DPU芯片的研发也在有序进行中,不久即将面世,敬请期待。”
xFusion50产品核心亮点
l 支持可编程拥塞控制算法
可编程拥塞控制算法是实现端到端无损网络的关键技术,xFusion50不仅能支持业界主流的拥塞控制算法,还可以通过开放可编程的底层网络接口,可根据客户的组网特点和上层业务的需求,灵活支持多种拥塞控制算法,最大化业务的流量吞吐。
l 通过自主研发HyperDirect技术支持GPU Direct RDMA
为跨计算节点的GPU实现远程内存直接访问,跳过CPU以降低时延、提升带宽,提升分布式异构算力集群的整体效能。
l 支持网络/存储全场景卸载加速
支持vSwitch全卸载,实现云上VPC网络全功能;支持存储卸载,对接分布式存储NVMe-oF(TCP/RDMA),充分释放宿主机CPU资源。并通过支持VirtIO实现弹性网络和弹性存储,满足云上用户无缝迁移和快速恢复的业务诉求。
xFusion50产品适用场景及解决方案
高性能集群场景
AI、HPC、分布式存储等高性能集群场景中,对节点间的数据处理与通信有着低时延和高吞吐的诉求,xFusion50支持基于以太网的RDMA组网和可编程拥塞控制算法,实现高性能场景对低时延和高吞吐的需求,并配合云脉芯联提供的xsc-easy-bench可大幅提升业务上线调试效率。
云计算场景
传统云计算架构基于CPU的软件虚拟化技术提供IaaS业务,大量CPU资源被用于处理与租户业务无关的hypervisor层,租户与云hypervisor共享CPU,租户业务容易被管理业务影响,造成抖动。xFusion50为云计算场景提供了一种基于裸金属云的基础设施架构,将hypervisor层卸载到xFusion50上,可满足虚拟机、裸金属、容器多种云上资源供给,并提供网络/存储加速功能,兼顾灵活性与高性能。
关于云脉芯联
云脉芯联创立于2021年5月,是一家专注于云数据中心网络芯片产品研发与技术创新的高科技创新企业。公司以“构建数字世界的互联底座”为发展愿景,致力于打造用于大规模数据中心和云计算基础设施的网络互联芯片,帮助用户构建端网融合的高性能网络基础设施,以应对进入全面数字化和智能化时代的技术挑战。
好文章,需要你的鼓励
Anchor Browser获得600万美元种子轮融资,专注解决AI代理安全可靠地使用网络的挑战。该公司重新设计浏览器作为云端执行层,为每个AI代理提供独立安全的浏览器环境。与传统浏览器不同,Anchor的b0.dev系统让代理能够规划工作流程并可靠重复执行,将混乱的自动化转变为企业级软件工程。
清华大学研究团队开发的SLA技术通过将AI视频生成中的注意力权重智能分类,对不同重要程度的权重采用差异化计算策略,成功实现了95%的计算量减少和20倍的速度提升,同时保持视频质量不变,为AI视频生成效率优化开辟了新思路。
英国竞争与市场管理局经过九个月调查,将谷歌和苹果的移动平台指定为具有战略市场地位。监管机构表示,两家公司在移动平台领域拥有根深蒂固的市场主导地位,其平台规则可能限制创新和竞争。这一指定使监管机构能够考虑采取针对性干预措施,确保英国应用开发者能够创新和发展业务,但目前尚未引入任何直接要求。
斯坦福大学等机构联合提出多人Nash偏好优化(MNPO),突破传统双人训练局限,让AI在多人游戏环境中学习处理复杂非传递性偏好。该方法通过时间依赖设计,让AI与历史版本对话练习,在所有主要测试中显著超越现有方法,在Arena-Hard中甚至超过GPT-5,为AI对话系统训练提供了更贴近真实世界复杂性的新范式。