铠侠宣布开源AiSAQ技术,可降低生成式AI系统中的DRAM需求
编辑:Andy 发布:2025-02-06 14:58铠侠近日宣布开源其全新全存储 ANNS 产品量化 (AiSAQ) 技术,这是一种针对 SSD 优化的新型“近似最近邻”搜索 (ANNS) 算法,它为检索增强生成 (RAG) 提供了可扩展的性能,无需将索引数据放置在 DRAM 中 - 而是直接在 SSD 上进行搜索。
生成式 AI 系统需要大量的计算、内存和存储资源。虽然它们有可能推动各个行业的变革性突破,但部署它们通常需要高昂的成本。RAG 是 AI 的一个关键阶段,它使用特定于公司或应用程序的数据来完善大型语言模型 (LLM)。
RAG 的核心组件是向量数据库,它可以累积特定数据并将其转换为数据库中的特征向量。RAG 还利用 ANNS 算法,该算法根据累积向量与目标向量之间的相似性来识别可以改进模型的向量。要使 RAG 有效,它必须快速检索与查询最相关的信息。传统上,ANNS 算法部署在 DRAM 中以实现这些搜索所需的高速性能。
KIOXIA AiSAQ 技术为十亿级数据集提供了可扩展且高效的 ANNS 解决方案,具有极低的内存使用量和快速的索引切换功能。
KIOXIA AiSAQ 技术的主要优势:
允许大型数据库在不依赖有限的 DRAM 资源的情况下运行,从而增强 RAG 系统的性能。
无需将索引数据加载到 DRAM 中,矢量数据库可即时启动。这支持在同一台服务器上无缝切换用户专用或应用专用数据库,从而实现高效的 RAG 服务交付。
通过将索引存储在分类存储中以供多台服务器共享,针对云系统进行了优化。此方法可针对特定用户或应用程序动态调整矢量数据库搜索性能,并促进搜索实例在物理服务器之间的快速迁移。