news 2026/7/3 22:56:31

RAG的技术发展

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
RAG的技术发展

RAG 技术已从早期的‌朴素检索(Naive RAG)‌演进为具备‌结构化推理‌与‌智能体自主决策‌的复杂系统。当前主流技术范式及演进逻辑如下:

Naive RAG(原生/基础 RAG)‌

‌定义‌:最基础形态,流程为“文档切块→向量化→向量检索→拼接生成”。
‌局限‌:仅依赖语义相似度,难以处理多跳推理、全局宏观理解及实体间复杂关系,易产生幻觉 。
‌地位‌:当前工业界简单问答场景的基线标准,但正逐渐被高级范式补充或替代 。‌‌

GraphRAG(图谱增强 RAG)‌

‌核心‌:引入‌知识图谱‌,将非结构化文本转化为“实体 - 关系”图结构,支持‌社区聚类‌与‌分层摘要‌。
‌优势‌:解决 Naive RAG“连点成线”难题,擅长‌全局理解‌(如总结整个知识库趋势)和‌多跳推理‌ 。
‌代价‌:构建成本高(需大量 LLM 抽取实体),增量更新困难,适合静态或低频更新的大规模知识库 。
‌代表‌:Microsoft GraphRAG(2024 年主推),通过 Leiden 算法聚类实现 Global Search 与 Local Search 。‌‌

SAG (SQL-Retrieval Augmented Generation)‌

‌核心‌:2026 年新晋 SOTA 范式,用‌关系型数据库(SQL)‌重构数据底座。将文本解析为“事项(Event)+ 实体(Entity)”,利用‌超边结构‌连接多对多关系。
SAG(SQL 检索增强生成)‌:全称 SQL-Retrieval Augmented Generation,通过 SQL 驱动检索部分,重构 Agent 数据底座。
‌核心架构‌:离线阶段将原始文本整理成"事项 + 实体"的数据库结构,查询时用 SQL 动态串联局部线索网 。
‌超边结构‌:一个事件(event)可连接多个实体(entity),形成多对多关联,比三元组更轻便且保留完整语义 。
‌混合检索‌:结合 SQL 精准检索和向量语义匹配能力,既支持实体精确匹配,也支持语义模糊搜索
‌优势‌:

  • ‌动态扩展‌:无需预建全局图,查询时通过 SQL Join 临时组装局部线索网,支持‌秒级延迟‌处理亿级数据 。 ‌多跳推理强‌:在
    HotpotQA 等多跳测试中召回率显著优于 HippoRAG 2,更适合 Agent 长期记忆与状态追踪 。
    ‌易维护‌:支持增量写入,避免 GraphRAG 的全量重建痛点 。

‌定位‌:平衡了结构化推理与工程落地成本,是 Agent 时代的高性价比数据底座 。‌‌

Agentic RAG(智能体 RAG)‌

‌核心‌:赋予模型‌自主决策权‌,模型可判断“是否检索”、“何时检索”及“如何迭代优化”。
‌特点‌:融合工具调用、多轮反思与自我纠错,不再是线性流水线,而是动态规划系统 。
‌趋势‌:常与 GraphRAG 或 SAG 结合,作为上层调度器使用 。‌‌

LLM Wiki‌

LLM Wiki‌:通常指基于维基结构的‌结构化知识库‌范式。不同于 Naive RAG 的扁平切片,它强调‌手动或半自动的 WikiLink‌关联,具备持续积累能力,但缺乏自动化的深度关联推断,常作为 GraphRAG 的数据源或轻量级替代方案 。

技术融合趋势‌:单一范式难以通吃,未来主流是‌混合架构‌。例如:底层用 SAG/GraphRAG 存储结构化知识,上层用 Agentic RAG 进行路由与决策,同时支持多模态输入 。‌‌谷歌在本月发布的okf标准

选型建议

‌简单问答/低成本‌:Naive RAG + 重排(Rerank)。
‌全局总结/复杂关系推理‌:GraphRAG(接受高构建成本)。
‌大规模动态数据/Agent 记忆/多跳查询‌:‌SAG‌(当前工程落地优选)。
‌复杂任务规划‌:Agentic RAG(需搭配上述任一检索后端)。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/29 0:28:21

告别低效搬砖!实测2026社区版AI智能体:个人与工作室的自动化“真香”还是“深坑”?

随着2026年全球智能体(Agent)技术的爆发式普及,我们正处于从“人人都有大模型”向“人人都有数字员工”跨越的关键节点。对于预算有限的个人开发者和初创小工作室而言,市面上琳琅满目的“免费社区版”智能体似乎成了降本增效的救命…

作者头像 李华
网站建设 2026/6/29 1:23:45

什么是 RAG 中的 Rerank?从原理到实战的完整指南

什么是 RAG 中的 Rerank?从原理到实战的完整指南 Rerank 是 RAG 系统中连接检索与生成的关键桥梁——用更精细的语义分析,把真正相关的文档排到最前面。 引言 在 RAG(检索增强生成)系统中,有一个经常被忽视却至关重要的环节——Rerank(重排序)。简单来说,它就是在向量…

作者头像 李华
网站建设 2026/6/29 0:28:27

别再用低代码玩具糊弄人!2026智能体编排“诸神之战”:谁能真正重塑大中型企业AI协同中枢?

2026 年,企业对 AI 的期待已经彻底告别了“能不能对话”、“能不能帮我写篇周报”的浅层尝试阶段,全面挺进核心业务的“无人区”与深水区。当下面面临的最严酷、最残酷的商业拷问是:AI 究竟能不能组织多个智能体协同作战?能不能跨…

作者头像 李华
网站建设 2026/6/29 0:28:25

商用项目部署全流程拆解:从代码审计到生产上线的六个关键节点

一、审计阶段:拿到代码第一件事不是部署,是审① 目录结构扫描先不跑代码,先看目录。一个项目的目录结构能直接反映架构水平。核心判断标准:业务逻辑是否和框架代码分离。如果控制器里嵌着数据库连接、模板里写着业务判断&#xff…

作者头像 李华
网站建设 2026/6/29 0:42:58

Java毕业设计-基于 SpringBoot 框架的智能化社区健康监测系统的设计与实现 基于 SpringBoot 的智慧社区健康信息管理系统的(源码+LW+部署文档+全bao+远程调试+代码讲解等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华