news 2026/4/14 21:05:19

KTO: Kahneman-Tversky优化

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
KTO: Kahneman-Tversky优化

文章目录

      • KTO方法的理论基础
      • 损失函数设计原理
      • 数据效率优势
      • 实现关键步骤

KTO方法的理论基础

KTO(Kahneman-Tversky Optimization)的核心思想源于行为经济学的前景理论。该理论指出人类决策时对收益和损失存在非对称心理反应,表现为损失厌恶(loss aversion)效应。传统RLHF依赖二元偏好对数据,而KTO通过量化这种心理差异,实现单样本绝对标注下的有效优化。

损失函数设计原理

KTO的损失函数包含两个关键组成部分:

  • 收益项:处理被标注为"好"的样本时,采用凸函数形式增强模型输出与标注的一致性
  • 损失项:处理"坏"样本时使用更陡峭的惩罚曲线,反映人类对负面结果的强烈规避倾向

数学表达为:
L K T O = E [ w ( y ) ( 1 − σ ( β Δ ( y ) ) ) ] \mathcal{L}_{KTO} = \mathbb{E}[w(y)(1-\sigma(\beta \Delta(y)))]LKTO=E[w(y)(1σ(βΔ(y)))]
其中Δ ( y ) \Delta(y)Δ(y)表示样本评分与参考值的偏差,w ( y ) w(y)w(y)是方向敏感权重函数。

数据效率优势

相比传统偏好学习方法,KTO具有显著优势:

  • 无需构建偏好对y w > y l y_w > y_lyw>yl,直接利用原始单样本标注
  • 支持从部分标注、噪声标注等弱监督数据中学习
  • 对标注一致性的要求降低30-50%,实践中标注成本可减少40%以上

实现关键步骤

模型训练时需注意:

  • 参考值设定建议采用模型当前输出的移动平均
  • 温度系数β \betaβ需通过验证集调整,典型值区间为0.1-0.3
  • 损失项权重通常设为收益项的2-3倍以匹配损失厌恶系数

实验数据显示,在相同标注预算下,KTO相比DPO等方法的胜率提升达15-20%,且在长文本生成等复杂任务中优势更为明显。

https://github.com/ContextualAI/HALOs

classDummyKTOTrainer(UnpairedPreferenceTrainer):"""A fake version of KTO (not the actual one!) meant to introduce you to the HALOs repo."""defloss(self,policy_chosen_logps:torch.FloatTensor,policy_rejected_logps:torch.FloatTensor,reference_chosen_logps:torch.FloatTensor,reference_rejected_logps:torch.FloatTensor)->Tuple[torch.FloatTensor,torch.FloatTensor,torch.FloatTensor]:chosen_KL=(policy_chosen_logps-reference_chosen_logps).mean().clamp(min=0)rejected_KL=(policy_rejected_logps-reference_rejected_logps).mean().clamp(min=0)chosen_logratios=(policy_chosen_logps-reference_chosen_logps)rejected_logratios=(policy_rejected_logps-reference_rejected_logps)losses=torch.cat((1-F.sigmoid(self.config.loss.beta*(chosen_logratios-chosen_KL)),1-F.sigmoid(self.config.loss.beta*(rejected_KL-rejected_logratios))),0)chosen_rewards=self.config.loss.beta*(policy_chosen_logps-reference_chosen_logps).detach()rejected_rewards=self.config.loss.beta*(policy_rejected_logps-reference_rejected_logps).detach()returnlosses,chosen_rewards,rejected_rewards
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/14 20:57:39

Docker容器化部署魔兽世界服务器:新手友好的一键搭建指南

Docker容器化部署魔兽世界服务器:新手友好的一键搭建指南 【免费下载链接】azerothcore-wotlk Complete Open Source and Modular solution for MMO 项目地址: https://gitcode.com/GitHub_Trending/az/azerothcore-wotlk 还在为搭建AzerothCore-WoTLK服务器…

作者头像 李华
网站建设 2026/4/13 11:00:12

Orleans分布式追踪实战:从工具选型到部署优化

Orleans分布式追踪实战:从工具选型到部署优化 【免费下载链接】orleans dotnet/orleans: Orleans是由微软研究团队创建的面向云应用和服务的分布式计算框架,特别适合构建虚拟 actor模型的服务端应用。Orleans通过管理actors生命周期和透明地处理网络通信…

作者头像 李华
网站建设 2026/4/9 13:10:28

3步轻松上手Phi-3:AI小模型大能量的完整使用指南

3步轻松上手Phi-3:AI小模型大能量的完整使用指南 【免费下载链接】Phi-3-mini-4k-instruct-gguf 项目地址: https://ai.gitcode.com/hf_mirrors/ai-gitcode/Phi-3-mini-4k-instruct-gguf 想要快速体验AI模型的强大功能却担心配置复杂?Phi-3-mini…

作者头像 李华
网站建设 2026/4/15 8:57:37

论文提纲生成工具排名:AI如何帮你一键搞定论文框架

论文提纲生成工具排名:AI如何帮你一键搞定论文框架 论文提纲生成工具核心对比 工具名称 生成速度 逻辑性 学术深度 适用阶段 AIbiye ⚡⚡⚡⚡ ⭐⭐⭐⭐ ⭐⭐⭐ 选题/大纲 AICheck ⚡⚡⚡ ⭐⭐⭐⭐ ⭐⭐⭐⭐ 大纲/开题 AskPaper ⚡⚡ ⭐⭐⭐ ⭐⭐…

作者头像 李华
网站建设 2026/4/11 17:36:42

免费查重工具排名:7大平台+官网推荐

免费查重工具排名:7大平台官网推荐 核心工具对比速览 工具名称 查重效率 特色功能 适用场景 官网直达 Aibiye 20分钟 AIGC查重降重 学术论文深度优化 aibiye.com AICheck 15分钟 多维度AI检测 快速筛查AI生成内容 aicheck.com AskPaper 25分钟 学…

作者头像 李华
网站建设 2026/4/10 9:53:11

QFileInfoList-基础-问题盘点

这里是目录标题提问代码内存分配的核心原因entryInfoList()的执行逻辑:内存分配的细节内存管理的注意事项后果互动提问 你是否为了解QFileInfoList而惊喜过?你是否还不曾对QFileInfoList苦恼过? 不管是与不是,我都将抛出疑问&…

作者头像 李华