华为将推出AI SSD缓解GPU内存瓶颈问题

华为即将发布AI固态硬盘，配合统一缓存管理软件，将键值缓存数据从GPU高带宽内存中转移到SSD存储，避免重复计算以提升AI处理速度。该方案采用分层缓存架构，整合GPU内存、CPU内存和SSD存储。华为还将运用XtremeLink技术和SpeedFlex印刷电路板技术。此举旨在解决GPU服务器内存墙问题，帮助中国构建新的AI生态系统。

据报道，华为即将推出一款AI SSD，该产品将与其统一缓存管理器(UCM)软件协同工作，从GPU的高带宽内存中卸载键值(KV)缓存数据，通过避免KV缓存数据重新计算来加速AI处理。

当大语言模型执行时，它会以键和值的形式将数据存储在GPU的高带宽内存(HBM)中。在长时间推理运行的情况下，这个缓存会被新的KV数据填满，导致较旧的数据被驱逐，当再次需要时就必须重新计算。这种重新计算会延长大语言模型的运行时间，延迟对用户请求的响应。通过将被驱逐的KV数据存储在连接的SSD中，可以在需要时检索，从而缩短模型响应时间。

即将推出的华为AI SSD据说有助于解决影响GPU服务器的内存墙问题，即有限的HBM容量会延长计算时间。美国的技术出口限制阻碍了中国使用最新GPU和HBM的努力。中国国内的内存制造商尚未开发出自己的HBM技术。华为AI SSD将具有大容量但未具体说明的存储空间，以及快速但同样未具体说明的I/O性能。

VAST Data和WEKA及其增强内存网格都有将KV缓存内容卸载到SSD的软件，中国的燕融存储系统供应商也有类似技术。PEAK:AIO和Pliops也提供KV缓存卸载解决方案。

华为的方案依赖其UCM软件提供分层KV缓存概念，包含GPU HBM、CPU DRAM内存和直连SSD存储，根据需要在各层之间移动数据。华为还拥有现有的XtremeLink技术，使用eKitStor Xtreme 200E SSD，采用PCIe Gen 4 x 4通道连接，提供高达6.5 GBps的读取速度和7 GBps的写入速度。

这个性能不错但并非顶尖。SK海力士的Platinum P41 M.2 SSD在相同的PCIe Gen 4 x 4配置下提供7 GBps读取和6.5 GBps写入速度。华为需要采用PCIe Gen 5互连技术才能获得12-14 GBps范围内更快的读写速度。燕融已经拥有国产PCIe 5 NVMe SSD。

报告还提到了华为的SpeedFlex PCB技术，涉及其印刷电路板的热可靠性和优化数据传输。这似乎并非尖端技术。

报告称，配备UCM、XtremeLink和SpeedFlex的AI SSD"代表了国产SSD的关键突破。华为将与国内训练和推理设备制造商合作，这将帮助中国构建新的AI生态系统，应对全球化挑战。"

Q&A

Q1：华为AI SSD是如何解决GPU内存瓶颈问题的？

A：华为AI SSD通过与统一缓存管理器软件协同工作，将GPU高带宽内存中的键值缓存数据卸载到SSD存储中。当GPU内存被新数据填满时，旧数据不会丢失而是存储在SSD中，需要时可直接检索，避免了重新计算，从而缩短大语言模型的响应时间。

Q2：华为AI SSD的性能表现如何？

A：华为AI SSD使用XtremeLink技术和eKitStor Xtreme 200E SSD，采用PCIe Gen 4 x 4通道连接，提供高达6.5 GBps读取速度和7 GBps写入速度。不过这个性能并非顶尖，SK海力士同类产品在相同配置下可达7 GBps读取和6.5 GBps写入速度。

Q3：为什么华为要开发AI SSD产品？

A：主要原因是美国技术出口限制阻碍了中国使用最新GPU和高带宽内存的努力，而中国国内内存制造商尚未开发出自己的HBM技术。华为AI SSD旨在通过创新的缓存管理方案缓解GPU内存瓶颈，帮助中国构建新的AI生态系统应对挑战。

来源：BLOCKS & FILES

0赞

好文章，需要你的鼓励

华为将推出AI SSD缓解GPU内存瓶颈问题

来源：BLOCKS & FILES

2025

08/27

11:11

分享

点赞

混合专家模型驱动最智能的前沿 AI 模型，在 NVIDIA Blackwell NVL72 系统上运行速度提升 10 倍

OpenAI计划下周发布GPT-5.2应对谷歌竞争

数据中心安全和设计缺口：被忽视的关键问题

Mac应用Vector：Spotlight的智能快速替代工具

斑马技术与牛津经济研究院联合调研：工作流程自动化助力生产率提升20%

智能体即服务将重塑软件行业和企业结构

谷歌AI模型在伪造手机拍照方面变得异常精准

英伟达确认新的安全漏洞，建议立即更新

家务机器人发展受阻：AI进化面临的机器人挑战

FreeBSD 15移除32位支持并重新设计系统构建方式

从孤立到战略：云"竞合"时代对CIO意味着什么

HPE网络业务大放异彩，服务器收入下滑，Alletra存储表现亮眼

谷歌发布新版图像生成AI挑战Photoshop地位

Anthropic推出Chrome浏览器AI智能体Claude

企业数据平台迎来生成式AI与开源格局双重重构

HPE通过增强Mist智能体AI技术推进自驱动网络运营

Okta收购Axiom Security加强AI身份安全防护

Gemini 2.5 Flash Image发布，图像编辑精度大幅提升

戴尔Project Lightning项目为PowerScale带来并行性能提升

Broadcom推出AI原生私有云VMware Cloud Foundation 9.0

英伟达大力投资光学技术推动AI计算性能突破

人工智能引领第四次工业革命的历史性变革

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: