本周,Kioxia 将旨在减少生成式 AI 系统中 DRAM 需求的 AiSAQ 技术作为开源软件发布。
AiSAQ(全称为"基于乘积量化的全存储式 ANNS")提供了一种针对 SSD 优化的"近似最近邻搜索" (ANNS) 算法。Kioxia AiSAQ 软件无需将索引数据存储在 DRAM 中,而是直接在 SSD 上进行搜索,从而为检索增强生成 (RAG) 提供可扩展的性能。
生成式 AI 系统需要大量的计算、内存和存储资源。Kioxia 表示:"虽然这些系统有潜力在各个行业推动变革性突破,但其部署通常成本高昂。" RAG 是 AI 的关键阶段,它通过公司或应用程序特定的数据来完善大语言模型 (LLM)。
RAG 的核心组件是一个向量数据库,它将特定数据累积并转换为用于检索的特征向量。RAG 还使用 ANNS 算法,该算法基于累积向量和目标向量之间的相似性来识别可改进模型的向量。Kioxia 表示:"为了使 RAG 有效,它必须能够快速检索与查询最相关的信息。"
传统上,ANNS 算法部署在 DRAM 中以实现这些搜索所需的高速性能。但 Kioxia 表示,AiSAQ 技术为十亿级数据集提供了一个"可扩展且高效"的 ANNS 解决方案,具有"可忽略的"内存使用量和"快速"的索引切换能力。
AiSAQ 的主要优势包括允许大规模数据库在不依赖有限 DRAM 资源的情况下运行,从而提高 RAG 系统的性能。它还消除了将索引数据加载到 DRAM 的需求,使向量数据库能够立即启动。这支持在同一服务器上在用户特定或应用程序特定的数据库之间切换,以实现高效的 RAG 服务交付。
它通过将索引存储在分布式存储中以实现多服务器共享,从而针对云系统进行了优化。这种方法可以针对特定用户或应用程序调整向量数据库搜索性能,并有助于在物理服务器之间迁移搜索实例。
Kioxia 欧洲首席技术官兼副总裁 Axel Stoermann 表示:"我们的 AiSAQ 解决方案为基于闪存 SSD 的生成式 AI 系统中的 RAG 应用提供了几乎无限的扩展可能。通过使用基于 SSD 的 ANNS,我们减少了对昂贵 DRAM 的依赖,同时满足了领先内存解决方案的性能需求,显著提升了大规模 RAG 应用的性能范围。"
好文章,需要你的鼓励
今天讲的出海案例是源杰科技,一家专注磷化铟激光器芯片的IDM(整合设备制造商)企业,2024年11月同步宣布赴港发行H股、并向美国华盛顿州子公司增资不超过5000万美元建设生产基地。
这项研究揭示了AI解释方法的重大转变:传统方法适用于单一预测任务,但面对能够多步推理、使用工具的智能体系统时显得力不从心。研究团队提出了轨迹级解释框架,能够准确诊断智能体在执行过程中的具体失败点,为下一代AI系统的透明化和可靠性提供了重要基础。
脑机接口领域投资热潮持续,中国首家超声脑机接口公司Gestala成立仅两个月就完成2160万美元融资,估值达1-2亿美元。该公司开发非侵入式超声脑机接口技术,旨在解决传统植入式设备需要手术的风险问题。创始人表示将利用资金进行研发、团队扩张和建设生产设施,目标年底完成首代原型。公司专注慢性疼痛管理等医疗应用,并计划利用中国制造优势和低成本临床试验加速产品开发。
加州大学洛杉矶分校研究团队开发了TIC-VLA机器人导航系统,解决了传统机器人"思考"与"行动"无法同步的核心问题。该系统采用双核心设计,一个负责语言理解和场景分析,另一个负责实时避障控制,通过"延迟语义控制接口"实现异步协作。在DynaNav仿真平台测试中成功率达55.29%,真实环境测试成功率达85%,为服务机器人、医疗辅助、物流仓储等领域提供了重要技术突破。