Kioxia 开源 AiSAQ 技术以减少 RAG 中的 DRAM 使用量

Kioxia 发布开源 AiSAQ 技术，旨在降低生成式 AI 系统中的 DRAM 需求。该技术为 SSD 优化的近似最近邻搜索算法，可直接在 SSD 上搜索，无需将索引数据放入 DRAM，从而实现检索增强生成 (RAG) 的可扩展性能。这一创新有望大幅提升大规模 RAG 应用的性能范围。

本周，Kioxia 将旨在减少生成式 AI 系统中 DRAM 需求的 AiSAQ 技术作为开源软件发布。

AiSAQ（全称为"基于乘积量化的全存储式 ANNS"）提供了一种针对 SSD 优化的"近似最近邻搜索" (ANNS) 算法。Kioxia AiSAQ 软件无需将索引数据存储在 DRAM 中，而是直接在 SSD 上进行搜索，从而为检索增强生成 (RAG) 提供可扩展的性能。

生成式 AI 系统需要大量的计算、内存和存储资源。Kioxia 表示："虽然这些系统有潜力在各个行业推动变革性突破，但其部署通常成本高昂。" RAG 是 AI 的关键阶段，它通过公司或应用程序特定的数据来完善大语言模型 (LLM)。

RAG 的核心组件是一个向量数据库，它将特定数据累积并转换为用于检索的特征向量。RAG 还使用 ANNS 算法，该算法基于累积向量和目标向量之间的相似性来识别可改进模型的向量。Kioxia 表示："为了使 RAG 有效，它必须能够快速检索与查询最相关的信息。"

传统上，ANNS 算法部署在 DRAM 中以实现这些搜索所需的高速性能。但 Kioxia 表示，AiSAQ 技术为十亿级数据集提供了一个"可扩展且高效"的 ANNS 解决方案，具有"可忽略的"内存使用量和"快速"的索引切换能力。

AiSAQ 的主要优势包括允许大规模数据库在不依赖有限 DRAM 资源的情况下运行，从而提高 RAG 系统的性能。它还消除了将索引数据加载到 DRAM 的需求，使向量数据库能够立即启动。这支持在同一服务器上在用户特定或应用程序特定的数据库之间切换，以实现高效的 RAG 服务交付。

它通过将索引存储在分布式存储中以实现多服务器共享，从而针对云系统进行了优化。这种方法可以针对特定用户或应用程序调整向量数据库搜索性能，并有助于在物理服务器之间迁移搜索实例。

Kioxia 欧洲首席技术官兼副总裁 Axel Stoermann 表示："我们的 AiSAQ 解决方案为基于闪存 SSD 的生成式 AI 系统中的 RAG 应用提供了几乎无限的扩展可能。通过使用基于 SSD 的 ANNS，我们减少了对昂贵 DRAM 的依赖，同时满足了领先内存解决方案的性能需求，显著提升了大规模 RAG 应用的性能范围。"

来源：BLOCKS & FILES

0赞

好文章，需要你的鼓励

Kioxia 开源 AiSAQ 技术以减少 RAG 中的 DRAM 使用量

来源：BLOCKS & FILES

2025

02/05

14:09

分享

点赞

当 AI 与数学在上海相遇：2025 WAIC背后的智慧革命

当科幻照进现实：傲鲨首款消费级外骨骼机器人 VIATRIX 惊艳亮相 WAIC 2025

施耐德电气发布“算电协同”洞察报告 数据中心能源挑战的“三层解法”

夸克AI眼镜来了！阿里巴巴发布首款自研 AI 眼镜研发进展

傅利叶WAIC 2025：带来 GR-3 新品首秀，开启具身智能康养新概念

谷歌新"网页指南"功能将用AI重组搜索结果页面

AI编程工具连续错误致用户数据全部丢失

对话后摩智能吴强：大模型90%计算需求将来自端边，存算一体是未来

两个计划，三个转变，华为服务体系面向AI再进化

服务行业数智化，共创AI新时代 华为中国政企用户峰会2025成功举办

英特尔将于年底前再裁员15% 并缩减晶圆厂投资规模

阶跃星辰发布三代基础大模型、成立生态联盟，并提出了模型的“好用标准”

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

生成式AI催生新物种，SaaS CRM掀起下半场变革战

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

施耐德电气发布“算电协同”洞察报告数据中心能源挑战的“三层解法”

服务行业数智化，共创AI新时代华为中国政企用户峰会2025成功举办