news 2026/6/6 14:42:51

常见的微调的方式有哪些?(Lora...)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
常见的微调的方式有哪些?(Lora...)

1.LoRA(Low-Rank Adaptation)

核心思想: 不修改原始权重,旁路添加低秩矩阵

┌─────────────────────────────────┐
│ 原始Linear层 (W: 4096×4096) │
│ ❄️ 冻结不训练 │
│ ↓ x │
│ W·x (输出) │
└─────────────────────────────────┘
+ (相加)
┌─────────────────────────────────┐
│ LoRA旁路 │
│ x → A(8×4096) → B(4096×8) │
│ 🔥 只训练这两个矩阵 │
│ ↓ │
│ B·A·x (输出) │
└─────────────────────────────────┘

2.Prompt Tuning

核心思想: 在输入序列前添加可学习的"软提示词"

原始输入:
[The, movie, is, great] → Encoder → 输出

Prompt Tuning:
[P1, P2, P3, ..., Pk, The, movie, is, great] → Encoder → 输出
↑____________↑
可学习的soft prompts
(只训练这些)

具体做法:

  • 模型权重全部冻结
  • 只在输入前添加 k 个可学习的embedding向量 (比如20个)
  • 只训练这20个向量
  • 参数量: 极少 (20 × 768维 ≈ 15K参数)

输入层:
┌──────────────────────────────────────┐
│ [🔥P₁] [🔥P₂] [🔥P₃] ... [🔥Pₖ] │ ← 可训练的prompt embeddings
│ [❄️The] [❄️movie] [❄️is] [❄️great] │ ← 真实输入(正常处理)
└──────────────────────────────────────┘

❄️ Transformer层 (冻结)

输出

3.Adapter

核心思想: 在Transformer层之间插入小型瓶颈网络

原始Transformer块: Input → Self-Attention → Add&Norm → FFN → Add&Norm → Output 加入Adapter后: Input → Self-Attention → Add&Norm → [🔥Adapter] → FFN → Add&Norm → [🔥Adapter] → Output ↑ ↑ 新插入的模块 新插入的模块

具体做法:

  • Transformer层冻结
  • 在每层后插入Adapter模块
  • 只训练Adapter参数
  • 参数量: 1-3% (取决于bottleneck大小)

4.IA3(Infused Adapter by Inhibiting and Amplifying Inner Activations)【基本不用】

核心思想: 用可学习的缩放向量调整激活值

原始: h = W·x IA3: h = (W · diag(l)) · x = W · (l ⊙ x) ↑ ↑ 可学习的缩放向量 逐元素相乘

具体做法:

  • 权重矩阵W冻结
  • 只学习一个缩放向量l(长度等于输入维度)
  • 将输入x逐元素乘以l,然后再乘以W
  • 参数量: 极少 (每层只有一个向量, 比如768个参数)

可视化:

对于 K、V、FFN 的投影: 输入 x (768维) ↓ x ⊙ l_k (逐元素相乘) ← 🔥 l_k是768维可训练向量 ↓ ❄️ W_k · (缩放后的x) ← W_k冻结 ↓ 输出

5.Full FT(Full Fine-Tuning / 全量微调)

核心思想: 所有参数都训练

预训练模型的所有参数 → 🔥全部解冻 → 在下游任务上训练

具体做法:

  • 加载预训练权重
  • 所有层的所有参数都设为可训练
  • 在目标数据集上重新训练
  • 参数量: 100%

6.固定Encoder(Feature Extraction)

核心思想: 把预训练模型当特征提取器,只训练新加的分类头

输入 → ❄️Encoder(冻结) → 特征 → 🔥分类头(新建+训练) → 输出

具体做法:

  • Encoder所有层冻结
  • 去掉原来的输出层,加一个新的(比如线性层)
  • 只训练这个新的分类头
  • 参数量: <1% (只有分类头)

https://mp.weixin.qq.com/s/aAIuZ8LH3flnxNLtlP6d0w

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/5 7:02:29

StructBERT实战教程:用户反馈情感分析系统

StructBERT实战教程&#xff1a;用户反馈情感分析系统 1. 引言 1.1 中文情感分析的现实需求 在当今数字化服务快速发展的背景下&#xff0c;企业每天都会收到海量的用户反馈——来自电商平台评论、客服对话记录、社交媒体留言等。如何高效地理解这些文本背后的情绪倾向&…

作者头像 李华
网站建设 2026/5/25 19:31:16

StructBERT情感分析API开发:零基础快速上手教程

StructBERT情感分析API开发&#xff1a;零基础快速上手教程 1. 引言 1.1 中文情感分析的现实需求 在当今数字化时代&#xff0c;用户评论、社交媒体内容、客服对话等海量中文文本数据不断涌现。如何从中自动识别情绪倾向——是满意还是不满&#xff1f;是推荐还是投诉&#…

作者头像 李华
网站建设 2026/5/27 1:09:49

中文情感分析实战:StructBERT模型调优

中文情感分析实战&#xff1a;StructBERT模型调优 1. 引言&#xff1a;中文情感分析的现实需求与挑战 在社交媒体、电商评论、客服对话等场景中&#xff0c;用户生成内容&#xff08;UGC&#xff09;呈爆炸式增长。如何从海量中文文本中自动识别情绪倾向&#xff0c;成为企业…

作者头像 李华
网站建设 2026/6/2 0:37:56

StructBERT应用案例:产品口碑监测系统搭建

StructBERT应用案例&#xff1a;产品口碑监测系统搭建 1. 中文情感分析在产品口碑监测中的价值 随着社交媒体和电商平台的蓬勃发展&#xff0c;用户对产品和服务的评价数据呈爆炸式增长。企业迫切需要一种高效、准确的方式&#xff0c;从海量中文文本中自动识别用户情绪倾向&…

作者头像 李华
网站建设 2026/5/29 12:40:37

国内大佬又出神器,一键屏蔽阻止各种流氓软件 / 下崽器/弹窗广告,电脑小白必装工具!Baidun Armor

下载链接 https://tool.nineya.com/s/1jbuat980 软件介绍 Baidun Armor是一款免费无广用于拦截及屏蔽各种不受欢迎程序的软件&#xff0c;例如某些下崽器、捆绑器、流氓软件安装器等等。采用云端自动更新拦截库&#xff0c;可自动实时识别特定开发厂商的软件并拦截潜在文件行…

作者头像 李华
网站建设 2026/6/4 12:56:51

智能监控系统DIY教程:200元预算玩转AI异常识别

智能监控系统DIY教程&#xff1a;200元预算玩转AI异常识别 1. 为什么选择云端AI监控方案&#xff1f; 农场主老王最近很头疼&#xff1a;仓库总有人偷饲料&#xff0c;装了几个普通摄像头只能事后查录像&#xff0c;根本防不住。专业安防系统动辄上万元&#xff0c;而树莓派跑…

作者头像 李华