外部控制器接口特别兴趣小组(简称PCI-SIG)已经公布了PCI 5.0技术路线图,并计划于2019年正式发布这一速度高达每秒128GB的传输标准。这意味着上一代PCI 4.0的速度仅相当于新规范的一半。
特别兴趣小组在上周召开了其年度DevCon大会,此次会议的基本内容为要求每年三年将I/O传输带宽提升一倍,旨在借此追及400 Gbps以太网等其它传输能力提升的发展步伐。根据这一标准来判断,尽管PCI 4.0尚处于0.9版本,但PCI 5.0仍将于2019年正式发布。
本次会议上的其它重点内容还包括加快PCIe 4.0标准的普及速度:该规格提出的传输带宽水平为每秒64 GB。PCIe 5.0将把这一速度水平提升一倍,从而帮助设计师顺利实现其预期当中的各类实际应用场景——包括AI、机器学习、视觉计算、快速存储与双200 Gb每秒InfiniBand连接等。额外的传输带宽也将进一步提升GPU的实用性,允许其以更高密度实现部署。
PCI Express连接的过去、现在与未来每秒传输能力对比,其单位为“GT每秒”
PCIe 5.0目前已经迎来0.3修订版,并开始提供给该特别兴趣小组的700多名成员进行参考。事实上,其中众多成员目前仍在努力消化4.0版本方案——PCIe 4.0目前处于0.9版本,其“功能完整”且只待实际使用。特别兴趣小组表示,“我们的PCIe 4.0合规性测试引发了前所未有的高度关注,早期试用者已经测试了十余种每秒16 GT解决方案。”
这样的关注度亦在我们的意料之中,毕竟对于云计算以及AI这类工作负载而言,对于速度的需求几乎可以说永无止境。
PCI特别兴趣小组中囊括了全部大型PC与服务器制造商,因此一旦新标签得到通过,组件生态系统也将被快速建立起来。除了存储级内存,这项新规范还将为机器学习专用CPU、400 Gbps以太网以及未来几年内的加速计算方案带来巨大提升。
好文章,需要你的鼓励
在我们的日常生活中,睡眠的重要性不言而喻。一个晚上没睡好,第二天的工作效率就会大打折扣,而充足的睡眠不仅能让我们恢复精力,还能帮助大脑整理和巩固当天学到的知识。有趣的是,AI模型竟然也表现出了类似的“睡眠需求”。
DeepSeek-AI团队通过创新的软硬件协同设计,仅用2048张GPU训练出性能卓越的DeepSeek-V3大语言模型,挑战了AI训练需要海量资源的传统观念。该研究采用多头潜在注意力、专家混合架构、FP8低精度训练等技术,大幅提升内存效率和计算性能,为AI技术的民主化和可持续发展提供了新思路。
尽管模型上下文协议(MCP)自11月推出以来用户数量快速增长,但金融机构等监管行业仍保持谨慎态度。银行等金融服务公司虽然在机器学习和算法方面是先驱,但对于MCP和Agent2Agent(A2A)系统的采用较为保守。监管企业通常只使用内部代理,因为其API集成需要经过多年审查以确保合规性和安全性。专家指出,MCP缺乏基本构建块,特别是在互操作性、通信标准、身份验证和审计跟踪方面。金融机构需要确保代理能够进行"了解您的客户"验证,并具备可验证的身份识别能力。
加拿大女王大学研究团队首次系统评估了大型视频语言模型的因果推理能力,发现即使最先进的AI在理解视频中事件因果关系方面表现极差,大多数模型准确率甚至低于随机猜测。研究创建了全球首个视频因果推理基准VCRBench,并提出了识别-推理分解法(RRD),通过任务分解显著提升了AI性能,最高改善幅度达25.2%。