Day5:微调 vs RAG 场景区分(面试高频)
一、先明确两个核心概念
1. 微调(Fine-tuning)
就是我们前面学的 SFT / LoRA,核心逻辑是:
- 用标注数据训练模型参数,把知识 / 风格 “刻进模型里”
- 训练后模型自带该能力,不用每次额外输入
2. RAG(Retrieval-Augmented Generation,检索增强生成)
核心逻辑是:
- 不改动模型本身,额外加一个 “知识库检索” 环节
- 提问时先从外部知识库检索相关内容,再把检索结果 + 问题一起喂给模型,让模型基于检索到的信息回答
二、核心区别对比(面试必背表格)
表格
| 对比维度 | 微调(Fine-tuning) | RAG(检索增强生成) |
|---|---|---|
| 核心逻辑 | 训练模型参数,让模型 “学会” | 不改动模型,给模型 “查资料” |
| 数据依赖 | 需要高质量标注数据 | 只需要结构化 / 非结构化知识库,无需标注 |
| 硬件成本 | 高,需要显卡算力 | 低,普通服务器就能跑 |
| 更新成本 | 高,数据 / 业务变更后要重新训练 | 低,直接更新知识库即可 |
| 知识准确性 | 依赖训练数据,过时知识会误导 | 依赖检索结果,信息可实时更新 |
| 长上下文支持 | 受模型上下文窗口限制 | 可通过分块 + 检索突破窗口限制 |
| 典型场景 | 固定话术、风格对齐、轻量领域知识 | 实时信息查询、大知识库问答、需要溯源 |
三、通俗场景类比(超好懂)
- 微调:就像给学生上课,把知识点教进他脑子里,之后他遇到相关问题就能直接答。
- RAG:就像开卷考试,学生本身不变,做题时给他一本参考资料,他照着资料回答。
四、面试高频场景题:该选微调还是 RAG?
✅ 优先选 微调 的场景
- 对话风格、语气、固定话术统一(比如客服固定回复模板)
- 轻量、稳定的领域知识(如固定产品参数、企业内部流程)
- 数据量不大、长期稳定不变的业务
- 需要模型 “天生自带” 某种能力,不想每次都检索
✅ 优先选 RAG 的场景
- 知识需要频繁更新(如实时新闻、政策、最新数据)
- 知识库体量很大(如企业百万级文档、行业百科)
- 需要回答可溯源(用户要求看到引用的原文出处)
- 数据质量参差不齐,无法做高质量标注
五、组合使用(工业界主流方案)
实际项目中,两者常结合使用:
- 用微调统一模型的输出风格、格式、话术
- 用RAG补充最新、最详细的业务知识
- 最终实现:风格统一 + 内容准确 + 信息可溯源