news 2026/4/7 22:44:51

RAG完全指南:从嵌入到查询改写的五大核心技术(收藏必学)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
RAG完全指南:从嵌入到查询改写的五大核心技术(收藏必学)

在之前的文章中有提到RAG相关的内容,感兴趣的可以看看:知识库 RAG:原理、流程、问题与优化建议。

原理大概就是当用户向关联了知识库的 AI 智能体提出问题时,查询不会直接发送给 LLM,而是先在知识库(如企业的文档库,记忆库,数据库等)中检索相关信息。这种检索不仅仅是关键词匹配,而是“语义搜索”,理解用户提出的问题和词语背后的含义。系统会提取最相关的知识切片(chunk),并将这些切片“增强”到原始提示中,最终,这个增强后的提示被送入 LLM,基于上下文,生成既流畅自然又有事实依据的回复。

因此,RAG能够让 LLM 能够访问知识库的内容,突破静态训练数据的限制,利用企业内部文档或 Wiki 等专业知识降低了“幻觉”(虚假信息)的风险,另外一个重要优势是能够提供“引用”,明确指出大模型回复信息的来源,提升 AI 响应的可信度和可验证性,这个在一些财务或对于回复可信度要求较高的,极为重要。

但如果要想更深入了解下RAG相关的一些内容,有几个核心的概念,必须得先了解下,这里也结合最近在项目上的一些了解学习,以及市面上常见智能体平台来解释下。

1、嵌入

在 LLM 语境下,嵌入是文本(如词语、短语或文档)的数值表示,通常为向量(数字列表)。其核心思想是用数学空间表达语义和文本间的关系。含义相近的词或短语,其嵌入在向量空间中距离更近。

在百度千帆中,用户在知识库上传文件后,支持选择向量模型进行嵌入,就是把我上传的文件解析出来之后,对文件内容进行向量化表示。用户提问时,系统通过计算问题嵌入与文档嵌入的相似度,检索最相关的信息用于生成答案。一般常见的开源模型就是bge-large。向量化之后一般就是存储在ES数据库。

2、切片

将大文档拆分为更小、更易处理的片段。RAG 系统无法将整本大文档输入 LLM,而是处理这些小块。如下图,coze将一篇比较大的文档切分成小的片段。

而同样的文档,在百度千帆平台中,则被切成了575个小的分段。

不同的切片策略,会导致同一个切分出来的效果不一样,这里有几个点:

原因说明
✅ 分块大小(chunk size)最直接原因:小块 → 更多分段
✅ 分段重叠(overlap)重叠会显著增加块数
✅ 切分策略(智能语义 vs 固定)段落感知切分 vs 硬切
✅ 文本预处理差异是否去噪、压缩、去掉换行符,制表符等
✅ 平台默认设计哲学效率优先 vs 精度优先

在dify内,切片后会形成父子切片,子分段会被切得更细,这样在知识库内容的命中上会更精确。用户提问时,系统先通过 父分段 快速判断主题是否相关。若相关,则深入检索对应的 子分段 获取精确答案,这样可以避免在海量文本中盲目搜索,提升效率。

3、相似度

指两段文本或语义的相似程度,可分为表层(词汇重叠)和深层(语义)。如下面的两张图,在百度千帆和dify中,当知识库切片后,可以通过召回测试,测试其召回后的内容,并会对召回内容进行相似度的打分,分数越高,代表当前召回的文本切片相关度就越高。

文本相似度一般就是计算查询向量与所有文档向量的余弦相似度,返回 Top-K 最相似的文档,下图中,召回数量就是topk。

4、重排模型

对“Query-候选片段”重新排序并打分,更准确地修正知识检索环节后的排序结果。目前用的比较多的大部分都是开源的模型,bge-reranker-large,典型流程是:

初筛(Retrieval):用向量搜索从文档中快速召回 Top-K(如 K=100)候选。

重排(Reranking):用更精细的模型对这 K 个候选重新打分排序,选出最相关的 Top-N(如 N=5)送入 LLM,这样就能避免“检索到但排错位”的问题。如下图所示。

5、查询改写

当用户开启“多轮对话改写”后,在正式检索知识库之前,系统会插入一个额外的大模型处理步骤:获取上下文:收集当前对话的历史记录(history)和当前用户输入(current_question)。调用大模型,使用固定提示词模板(Prompt)引导模型输出:你是一个查询改写助手……要求输出仅为改写后的查询语句,不加解释、标注或其他内容。

用改写后的查询 替代原始输入,执行后续的知识库检索,从而提高后续知识检索的相关性和准确度。

最后唠两句

为什么AI大模型成为越来越多程序员转行就业、升职加薪的首选

很简单,这些岗位缺人且高薪

智联招聘的最新数据给出了最直观的印证:2025年2月,AI领域求职人数同比增幅突破200% ,远超其他行业平均水平;整个人工智能行业的求职增速达到33.4%,位居各行业榜首,其中人工智能工程师岗位的求职热度更是飙升69.6%。

AI产业的快速扩张,也让人才供需矛盾愈发突出。麦肯锡报告明确预测,到2030年中国AI专业人才需求将达600万人,人才缺口可能高达400万人,这一缺口不仅存在于核心技术领域,更蔓延至产业应用的各个环节。

那0基础普通人如何学习大模型 ?

深耕科技一线十二载,亲历技术浪潮变迁。我见证那些率先拥抱AI的同行,如何建立起效率与薪资的代际优势。如今,我将积累的大模型面试真题、独家资料、技术报告与实战路线系统整理,分享于此,为你扫清学习困惑,共赴AI时代新程。

我整理出这套 AI 大模型突围资料包【允许白嫖】:

  • ✅从入门到精通的全套视频教程

  • ✅AI大模型学习路线图(0基础到项目实战仅需90天)

  • ✅大模型书籍与技术文档PDF

  • ✅各大厂大模型面试题目详解

  • ✅640套AI大模型报告合集

  • ✅大模型入门实战训练

这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

①从入门到精通的全套视频教程

包含提示词工程、RAG、Agent等技术点

② AI大模型学习路线图(0基础到项目实战仅需90天)

全过程AI大模型学习路线

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的

④各大厂大模型面试题目详解

⑤640套AI大模型报告合集

⑥大模型入门实战训练

如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!

应届毕业生‌:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

👉获取方式:
有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/7 21:56:31

基于python OpenCV的车牌识别计费系统

基于Python OpenCV的车牌识别计费系统设计 第一章 绪论 停车场、高速公路等场景的车牌识别计费是智慧交通的核心应用环节,传统人工计费模式效率低、易出错,而商用车牌识别系统成本高、适配性差,难以满足中小场景的个性化需求。Python语言具…

作者头像 李华
网站建设 2026/3/23 5:57:07

计算机毕业设计之基于springboot的农产品信息管理系统

二十一世纪我们的社会进入了信息时代,信息管理系统的建立,大大提高了人们信息化水平。传统的管理方式对时间、地点的限制太多,而在线管理系统刚好能满足这些需求,在线管理系统突破了传统管理方式的局限性。于是本文针对这一需求设…

作者头像 李华
网站建设 2026/3/15 13:08:03

ZYNQ让卫星在太空“换脑”:基于动态部分可重构的星载智能处理革命

想象一下,一颗卫星在轨运行五年后,不是因硬件过时而被淘汰,而是通过“太空换脑手术”获得全新的智能处理能力——这正是动态部分可重构技术为航天领域带来的革命。 当传统卫星发射升空后,它的硬件功能就被永久固定,如同化石般无法进化。而太空环境中的单粒子效应等辐射威胁…

作者头像 李华
网站建设 2026/3/23 22:44:13

告别登录逻辑混乱!基于 SpringBoot 工厂+策略模式统一多端登录

各位开发者好,我是在项目里被登录功能折磨过无数次的老码农。还记得三年前接手一个多端登录项目,用户名密码、微信、手机号验证码三种登录方式挤在一个if-else里,新增支付宝登录时整整改了 17 处代码,最后还漏了一处校验 —— 从此…

作者头像 李华
网站建设 2026/4/5 18:01:41

记录一次MySQL+Redis实现优化百万数据统计的方式

提到历史项目,大家对它的第一印象可能会是数据量大、技术老旧、文档缺失、开发人员断层、"屎山"等。刚好这几天就接到了一个优化老项目的需求,客户反馈页面数据加载缓慢甚至加载不出来,希望能够做一些优化。 刚接到这个任务后真的…

作者头像 李华
网站建设 2026/3/27 12:37:08

机器学习 - 堆叠集成(Stacking)

摘要:堆叠集成(Stacking)是一种机器学习集成技术,通过分层组合多个基础模型和元模型提升预测性能。其核心流程包括:先用不同算法训练基础模型,再将它们的预测结果作为输入训练元模型,最终由元模…

作者头像 李华