10月16日,在北京举行的2018 XDF赛灵思开发者大会上,浪潮联合赛灵思宣布推出全球首款集成HBM2高速缓存的FPGA AI加速卡F37X,可在不到75W典型应用功耗提供28.1TOPS的INT8计算性能和460GB/s的超高数据带宽,适合于机器学习推理、视频转码、图像识别、语音识别、自然语言处理、基因组测序分析、NFV、大数据分析查询等各类应用场景,实现高性能、高带宽、低延迟、低功耗的AI计算加速。
浪潮集团副总裁李金在2018 XDF赛灵思开发者大会发表主题演讲
F37X是浪潮专为AI极致性能设计的尖端FPGA加速卡,它采用Xilinx Virtex UltraScale+架构,提供285万个系统逻辑单元和9024个DSP单元,INT8计算性能达到了28.1TOPS,集成8GB HBM2高速缓存,带宽达460GB/s,相比单DDR4 DIMM提升20倍。当AI计算模型尺寸小于HBM2容量时,可全部预先载入高速缓存之中,消除了外部读写带来的数据传输延迟并提高处理速度,使AI计算完全放到片上成为可能。性能数据显示,浪潮F37X在AI图像识别实时推理场景,基于GoogLeNet深度学习网络模型,当BatchSize=1时性能高达8600 images/s,是CPU性能的40倍。F37X典型应用功耗仅为75瓦,性能功耗比高达375Gops/W。此外,F37X板载24GB DDR4内存及双端口100Gbps高速网络接口。F37X设计为全高半长PCI-E 3.0板卡,紧致的尺寸可使得单台AI服务器支持更多加速卡设备,从而提供极限计算与通信性能。
全球首款集成HBM2的FPGA AI加速卡F37X
F37X可支持C/C++、OpenCL和RTL三种主流的编程语言开发环境。相应SDx工具套件内含SDAccel?、Vivado?及SDK工具,应用已有的OpenCV、BLAS、Encoder、DNN、CNN等加速库,实现对主流深度学习框架如Caffe、TensorFlow、Torch、Theano等的支持,覆盖机器学习推理、视频图像处理、数据库分析、金融、安全等典型AI应用领域,提供强大的生态支持,具备更加出色的易编程性,可灵活快速开发和迁移不同的AI定制算法应用,在软件生产力上实现了质的飞跃。
浪潮集团副总裁李金表示:“AI正以前所未有的速度重构产业创新,AI算法将不断快速迭代,线上推理将成为AI计算的主要场景。浪潮一直致力创新FPGA软硬件技术,帮助客户持续获得领先的AI计算竞争力。浪潮F37X加速卡将为全球用户提供快速可定制、实时高性能、高密低功耗的先进的FPGA解决方案,加速AI应用的线上部署。”
赛灵思公司数据中心销售副总裁Freddy Engineer表示:“浪潮因产品执行和创新而享誉全球。浪潮将为客户提供搭载Xilinx加速卡的服务器,我们为此而自豪。我们非常高兴能成为浪潮的开发合作伙伴,联合推出突破性产品F37X,它通过HBM2提供前所未有的内存带宽,将加速数据分析、AI和需要最低延迟数据访问的工作负载。”
浪潮是全球领先的AI计算力厂商,从计算平台、管理套件、框架优化、应用加速等四个层次致力于打造敏捷、高效、优化的AI基础设施。浪潮帮助AI客户在语音、图像、视频、搜索、网络等方面取得数量级的应用性能提升。据IDC《2017年中国AI基础架构市场调查报告》显示,浪潮AI服务器市场份额达57%高居第一。
好文章,需要你的鼓励
Creatio 推出革命性的 AI 原生 CRM 平台,将 AI 深度嵌入核心功能。新平台以对话式界面为中心,支持自然语言交互和 AI 代理自动化,彻底重塑了传统 CRM 系统。这一创新旨在提高效率、增强客户体验,并实现无需扩充人力的业务扩张。
OpenAI 正在推出一套新的 API 和工具,旨在帮助开发者和企业更高效地构建基于 AI 的代理,这些代理基于 OpenAI 自家首个 AI 代理 Deep Research 和 Operator 的技术。Deep Research 独立搜索互联网,生成丰富、组织良好且有引用的报告,而 Operator 则根据用户的文本指令自主控制网页浏览器光标并执行诸如查找体育票或进行预订等操作。
最近的MWC活动展示了5G和人工智能(AI)领域的诸多创新,而不仅仅是移动技术。根据GlobalData的研究,物联网(IoT)市场将在2023至2028年间以13.5%的年复合增长率(CAGR)增长,收入将从9596亿美元上升至1.8万亿美元,主要受企业应用的推动,并受到5G和AI的增强。
AI 行业正在努力将“代理”——能够代表用户执行多步骤操作的 AI 驱动软件——变为现实。包括谷歌在内的多家科技公司最近强调了代理功能,OpenAI 首席执行官山姆·阿尔特曼在一月份表示,2025 年将是 AI 代理“加入劳动力”的一年。