Kioxia 开源 AiSAQ 技术以减少 RAG 中的 DRAM 使用量

Kioxia 发布开源 AiSAQ 技术，旨在降低生成式 AI 系统中的 DRAM 需求。该技术为 SSD 优化的近似最近邻搜索算法，可直接在 SSD 上搜索，无需将索引数据放入 DRAM，从而实现检索增强生成 (RAG) 的可扩展性能。这一创新有望大幅提升大规模 RAG 应用的性能范围。

本周，Kioxia 将旨在减少生成式 AI 系统中 DRAM 需求的 AiSAQ 技术作为开源软件发布。

AiSAQ（全称为"基于乘积量化的全存储式 ANNS"）提供了一种针对 SSD 优化的"近似最近邻搜索" (ANNS) 算法。Kioxia AiSAQ 软件无需将索引数据存储在 DRAM 中，而是直接在 SSD 上进行搜索，从而为检索增强生成 (RAG) 提供可扩展的性能。

生成式 AI 系统需要大量的计算、内存和存储资源。Kioxia 表示："虽然这些系统有潜力在各个行业推动变革性突破，但其部署通常成本高昂。" RAG 是 AI 的关键阶段，它通过公司或应用程序特定的数据来完善大语言模型 (LLM)。

RAG 的核心组件是一个向量数据库，它将特定数据累积并转换为用于检索的特征向量。RAG 还使用 ANNS 算法，该算法基于累积向量和目标向量之间的相似性来识别可改进模型的向量。Kioxia 表示："为了使 RAG 有效，它必须能够快速检索与查询最相关的信息。"

传统上，ANNS 算法部署在 DRAM 中以实现这些搜索所需的高速性能。但 Kioxia 表示，AiSAQ 技术为十亿级数据集提供了一个"可扩展且高效"的 ANNS 解决方案，具有"可忽略的"内存使用量和"快速"的索引切换能力。

AiSAQ 的主要优势包括允许大规模数据库在不依赖有限 DRAM 资源的情况下运行，从而提高 RAG 系统的性能。它还消除了将索引数据加载到 DRAM 的需求，使向量数据库能够立即启动。这支持在同一服务器上在用户特定或应用程序特定的数据库之间切换，以实现高效的 RAG 服务交付。

它通过将索引存储在分布式存储中以实现多服务器共享，从而针对云系统进行了优化。这种方法可以针对特定用户或应用程序调整向量数据库搜索性能，并有助于在物理服务器之间迁移搜索实例。

Kioxia 欧洲首席技术官兼副总裁 Axel Stoermann 表示："我们的 AiSAQ 解决方案为基于闪存 SSD 的生成式 AI 系统中的 RAG 应用提供了几乎无限的扩展可能。通过使用基于 SSD 的 ANNS，我们减少了对昂贵 DRAM 的依赖，同时满足了领先内存解决方案的性能需求，显著提升了大规模 RAG 应用的性能范围。"

来源：BLOCKS & FILES

0赞

好文章，需要你的鼓励

Kioxia 开源 AiSAQ 技术以减少 RAG 中的 DRAM 使用量

来源：BLOCKS & FILES

2025

02/05

14:09

分享

点赞

人工智能是否存在泡沫风险的深度分析

AI系统在压力下学会战略性欺骗的深层原因

数据中心备份电力系统对比分析

Paxos以超1亿美元收购加密钱包初创公司Fordefi

腾讯发布"读图神器"HunyuanOCR，只用1%的参数就打败了行业巨头？

联想天津工厂入选“世界智能制造十大科技进展” 以零碳智造打造业内标杆

联想万全异构智算研发团队入选IEEE CyberSciTech 2025，RNL技术成果获国际认可！

首款搭载千问的AI硬件：夸克AI眼镜新品发布 次日门店现排队潮

ServiceNow或以超10亿美元收购网络安全初创公司Veza

谷歌云推出"PanyaThAI"计划加速泰国AI应用

英国产学合作推进光纤射频通信技术商业化进程

阿里巴巴推出可换电池设计的Quark AI智能眼镜

最热门的 AI 模型：它们的功能和使用方法

这款古怪的 AI 智能手机可以创建你的数字分身

Faireez 获 750 万美元融资，为租赁市场提供 AI 驱动的酒店式管家服务

Broadcom 大获全胜：70% 大型 VMware 客户购买其最全面解决方案

Peer 获得1050万美元元宇宙引擎投资，推出3D个人星球功能

获 3000 万美元融资，Crogl 发布面向安全分析师的全新 AI "钢铁侠战衣"

Turing 获得 1.11 亿美元融资，估值达到 22 亿美元，为 OpenAI 等大语言模型公司提供关键代码支持

Tavus 推出系列 AI 模型，实现实时人脸交互技术突破

Welevel 获得 570 万美元融资，革新程序化游戏开发

AI 驱动的卓越运营：企业如何通过人人可及的流程智能提升成功

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

首款搭载千问的AI硬件：夸克AI眼镜新品发布次日门店现排队潮