news 2026/5/18 21:20:44

CRINN:通过强化学习自动优化近似近邻算法

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CRINN:通过强化学习自动优化近似近邻算法

概述

本文的重点是优化高维向量空间中的近似近邻搜索(ANNS)。

近似近邻搜索是一种以略微牺牲搜索精度为代价来显著提高搜索速度的技术,最近已成为检索增强生成(RAG)和基于代理的 LLM 应用基础技术的组成部分。

传统的优化方法是由人工专家进行剖析、分析缓存缺失、调整数据结构并反复手动调整参数。

然而,这种方法既专业又耗费人力,而且在跟上硬件和应用环境的发展方面存在局限性。

因此,作者提出了一种新的优化框架–CRINN,它结合了 LLM 和强化学习。

CRINN 将代码执行速度视为一种奖励,并通过基于对比学习的强化学习自动生成高效的 ANNS 代码。

这样就能在不依赖人工调整的情况下生成连续改进的实现,从而在检索性能方面实现新的突破。

建议的方法

CRINN 将 ANNS 视为一个具有强化学习功能的优化问题,并将强化学习与对比学习相结合,以提高性能。
具体来说,该设计将现有的实现代码及其执行速度纳入提示,并允许 LLM 对某种实现更快的原因进行对比分析。

这样,模型就能学习到提高速度的模式,并生成新的、更好的代码。
生成的代码会被执行,并根据速度和可重复性给予奖励。

奖励用于执行基于组相对策略优化(GRPO)的强化学习,并按顺序更新模型。

奖励设计还侧重于每秒查询次数(QPS)和召回率之间的权衡,召回率范围[0.85,0.95]内的曲线下面积被用作标量奖励。

此外,以现有的名为 GLASS 的 ANNS 库为初始基础,对每个模块进行了顺序优化:图构建、探索和完善。

这种结构化方法将传统的专家协调自动化,并能开发出高效的搜索算法。

实验

实验测试了 CRINN 在 SIFT-128、GIST-960、MNIST-784、GloVe-25、GloVe-100 和 NYTimes-256 六个基准数据集上的性能。

我们选择了具有代表性的开源 ANNS 实现(如 ParlayANN、GLASS、NNDescent、PyNNDescent、Vearch 和 Voyager)进行比较。只使用 SIFT-128(欧氏距离)进行训练,然后根据其他数据集评估泛化性能。
结果,CRINN 在 MNIST-784 和 GIST-960 数据集上的处理速度提高了 85%,图构建模块的改进尤为显著。

另一方面,在一些数据集(如 NYTimes-256)上也观察到了性能下降,这表明优化可能会受到距离规模和数据特征的限制。
此外,增量模块优化的有效性也得到了证明,证实了底层 GLASS 持续改进的潜力。

总之,CRINN 集速度和准确性于一身,优于现有方法,为使用强化学习进行代码优化提供了一个新方向。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/11 17:29:00

vue和springboot框架开发的校园一卡通管理系统_学生卡管理系统44by5n49

文章目录具体实现截图主要技术与实现手段关于我本系统开发思路java类核心代码部分展示结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!具体实现截图 同行可拿货,招校园代理 vuesprivuespringboot_44by5n49 学生卡管理系统框架开…

作者头像 李华
网站建设 2026/5/15 23:10:12

「binlog 轮转(max_binlog_size)」** 和 **「binlog 清理(expire)」

目录标题一、先给结论(重点)二、max_binlog_size 为什么“看起来”会导致堆积?实际行为是:三、5.7:expire_logs_days 为什么“看起来不生效”?1️⃣ 生效条件(非常关键)2️⃣ 最常见…

作者头像 李华
网站建设 2026/5/15 10:40:45

【文献分享】DeconvBenchmark一种强大的工作流程,用于评估多组学数据的去卷积分析效果

文章目录介绍代码参考介绍 肿瘤的异质性对癌症的发展和治疗反应有着显著影响,但从整体分子数据中对其进行量化仍颇具挑战性。解混算法(用于估算总体样本中细胞类型的比例)提供了一种潜在的解决方案。然而,对于转录组或甲基化组数…

作者头像 李华
网站建设 2026/5/18 12:29:19

毕业季论文AIGC率破解指南:从99%降至5%的实战方案

市场上的降AI率工具良莠不齐,如何科学判断降AI率效果是很多学生、老师最关心的问题,担心降不来AI率,耽误时间还花不少钱。 本文将从以下五个维度系统,分析2025年主流的8个降AI工具,教大家如何选择适合自己的降AIGC工具…

作者头像 李华
网站建设 2026/5/16 15:57:43

AIGC检测严峻,毕业论文如何选择降AI工具?实测7个主流降AI工具排名

市场上的降AI率工具良莠不齐,如何科学判断降AI率效果是很多学生、老师最关心的问题,担心降不来AI率,耽误时间还花不少钱。 本文将从以下五个维度系统,分析2025年主流的8个降AI工具,教大家如何选择适合自己的降AIGC工具…

作者头像 李华