news 2025/12/24 9:46:58

RAG技术三阶段演进:从传统检索增强到智能体协作的完整指南!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
RAG技术三阶段演进:从传统检索增强到智能体协作的完整指南!

简介

文章详细介绍了检索增强生成(RAG)技术的三个演进阶段:传统RAG通过外部知识源提升模型回答准确性但效率低下;REFRAG引入数据压缩和过滤机制提高处理效率;Agentic RAG结合智能体概念,实现复杂任务规划和工具使用。这种技术演进使AI应用从简单知识检索升级为能够自主思考、规划和执行复杂操作的智能助手,为解决现实世界问题提供了强大工具。


大型语言模型(LLM)的实用性核心在于它们能接触到多少信息。为了突破训练数据的静态限制,行业内发展出了以检索增强生成(Retrieval-Augmented Generation, RAG)为基石的一系列技术。

RAG通过连接外部知识源,显著提升了LLM回答的准确性、时效性和可靠性。然而,随着应用场景的日益复杂,RAG架构也在不断进化,从最初的简单增强,走向了高效压缩和复杂的智能体协作。

传统RAG

传统的RAG架构为LLM提供了一个简单的外部知识通道。当用户提出问题时,流程如下:

  1. 查询与检索: 用户的提示首先被传递到一个检索模块(Search)。
  2. 提取上下文: 该模块会搜索预设的知识源,包括PDF文件、数据库、网页搜索或API等,并提取出最相关的文本片段。
  3. 增强生成: 系统将用户的原始查询与所有检索到的相关文本拼接在一起,形成一个冗长的“增强上下文提示”,然后将其发送给LLM(如GPT、Gemini或Claude)。
  4. 模型响应: LLM基于这个丰富的上下文生成最终答案。

优势在于简单有效,能显著减少模型“幻觉”,将回答锚定在具体事实之上。局限在于其“一刀切”的方法:它将检索到的所有信息一股脑地塞入LLM的上下文窗口,导致提示冗长,处理成本高昂,且响应延迟(首词元时间,TTFT)较长。

高效率的REFRAG

为了解决传统RAG的效率瓶颈,REFRAG(Representation For RAG,为RAG服务的表示法)架构应运而生。它不再强迫昂贵的LLM去阅读所有的原始文本,而是引入了智能的数据压缩和过滤机制:

  1. 查询与向量化: 用户查询输入后,系统检索到多个相关的文本块(Chunks)。
  2. 区块嵌入与过滤: 关键在于,这些文本块首先被转化为高度压缩的Token嵌入(Token Embeddings)或向量表示。一个由强化学习(RL)训练的“相关性检查器”会评估这些嵌入,并只选择其中最关键的少数区块保留其完整的文本形式。
  3. 混合上下文注入: 最终发送给LLM的提示是用户的查询、大量代表背景信息的压缩向量、以及极少数被选定的完整文本片段。
  4. 高效生成: LLM通过处理更少的原始词元和理解大量压缩向量,大幅提升了处理速度。

REFRAG的核心创新在于:它以极高的效率,变相地扩展了LLM处理信息的能力,在保持准确性的同时,能够实现数倍的加速和成本节约。

Agentic RAG

最新的演进是Agentic RAG(智能体RAG),它将RAG与自主智能体(Agent)的概念结合起来,实现了从简单的信息检索到复杂的任务规划和工具使用的飞跃。

Agentic RAG不再是一个单一的检索步骤,而是一个包含多个智能体的协作系统:

  1. 规划与分解: 用户的复杂提示首先被一个“聚合智能体”(Aggregator Agent)或“规划智能体”接收。这个智能体不会立即回答,而是利用LLM的推理能力(如ReAct、CoT或Planning)将复杂的任务分解成一系列子目标。
  2. 专业智能体协作: 聚合智能体会根据子任务的需求,派遣不同的专业智能体(Agent 1, Agent 2, Agent 3…)去执行操作。例如,一个智能体可能负责搜索本地数据(Local Data),另一个负责调用API,还有一个负责进行网页搜索(Web Search)。
  3. 定制化检索与记忆: 每个专业智能体可以独立地访问特定的数据源,并根据任务需要进行检索。更重要的是,它们被赋予了短期记忆和长期记忆的能力,使其能够在执行多步骤任务时保持上下文和连贯性。
  4. 最终聚合: 所有智能体完成它们的子任务后,聚合智能体收集所有结果和信息,并合成一个连贯、准确、且经过深度推理的最终回答。

Agentic RAG的价值在于,它不仅提供了外部知识,还赋予了系统推理、规划和执行复杂操作的能力,使其能够解决需要多步骤、多工具协作的现实世界问题,远远超出了传统RAG的范围。

这种技术的叠加和融合,预示着未来的 AI 应用将不仅是知识渊博的聊天机器人,更是能够自主思考、规划路径和利用专业工具的强大智能助手。

在大模型时代,我们如何有效的去学习大模型?

现如今大模型岗位需求越来越大,但是相关岗位人才难求,薪资持续走高,AI运营薪资平均值约18457元,AI工程师薪资平均值约37336元,大模型算法薪资平均值约39607元。

掌握大模型技术你还能拥有更多可能性

• 成为一名全栈大模型工程师,包括Prompt,LangChain,LoRA等技术开发、运营、产品等方向全栈工程;

• 能够拥有模型二次训练和微调能力,带领大家完成智能对话、文生图等热门应用;

• 薪资上浮10%-20%,覆盖更多高薪岗位,这是一个高需求、高待遇的热门方向和领域;

• 更优质的项目可以为未来创新创业提供基石。

一直在更新,更多的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,下面是我整理好的一套完整的学习路线,希望能够帮助到你们学习AI大模型。

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

三、AI大模型经典PDF书籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

四、AI大模型各大场景实战案例

结语

【一一AGI大模型学习 所有资源获取处(无偿领取)一一】
所有资料 ⚡️ ,朋友们如果有需要全套 《LLM大模型入门+进阶学习资源包》,扫码获取~

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2025/12/17 22:08:26

极坐标波束形成数据底跟踪算法详解

极坐标波束形成数据底跟踪算法详解 一、基本概念 1.1 底跟踪的定义 底跟踪(Bottom Tracking)是通过声学回波信号检测和跟踪海底位置的技术,主要用于: 测量船舶相对于海底的速度确定水深辅助水下导航定位补偿多普勒计程仪测量 …

作者头像 李华
网站建设 2025/12/17 22:08:13

【技术教程】TrustFlow 授权策略是怎么实现的?

打开链接即可点亮社区Star,照亮技术的前进之路。 Github 地址:https://github.com/secretflow/trustflow/ TrustFlow提供了一套简洁易懂的语法帮助用户对数据使用行为的授权进行描述。接下来我们会详细描述这套语法,并结合示例进行讲解。 …

作者头像 李华
网站建设 2025/12/17 22:07:33

丐版 OI 技巧 / 杂项部分总结 + 作者学习笔记

持久化区间修改区间查询线段树:SP11470 TTM - To the moon点击查看代码2. 有后效性的 dpCF24D Broken robot一般用高斯消元 求解。也可以多跑几遍朴素 dp 使误差降到可接受范围内。多跑几遍的代码3. P14402 [JOISC 2016] 危险的滑冰 / Dangerous Skating图论建模。思…

作者头像 李华
网站建设 2025/12/17 22:07:32

CBAM核查规则正式明确:这4类企业,2025年开始风险差距会被迅速拉开

一、CBAM真正进入“可核查阶段”,企业开始被分层随着欧盟正式公布 CBAM 两项关键核查法规草案(授权法规 实施法规),CBAM 已经不再只是“填报义务”,而是进入可核查、可追责、可比较阶段。对中国出口企业来说&#xff…

作者头像 李华
网站建设 2025/12/17 22:06:36

AI 模型识别 Nginx 流量中爬虫机器人的防御机制

要实现基于AI模型识别Nginx流量中爬虫机器人的防御机制,核心思路是从Nginx流量中提取特征→训练AI模型区分爬虫/正常请求→将模型集成到Nginx中实时拦截。以下是分步骤的详细落地指南,从入门到实操,覆盖全流程: 一、先明确核心边界…

作者头像 李华
网站建设 2025/12/17 22:06:29

【Wolfram语言】20Ex 绘制洛书

引言 近日看到有关河图洛书的视频。我突发奇想,能否用目前所介绍的Wolfram语言来绘制一幅洛书呢? 起源 《周易》有云:“河出图,洛出书,圣人则之”。 传说上古有神龟从洛水出现,背负‘洛书’。 其图如下: 分析 粗看洛书是以黑点与白点排列成33矩阵。 因此可将九个数…

作者头像 李华