news 2026/5/20 12:53:45

Logits与softmax

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Logits与softmax

参考内容:

(59 封私信 / 30 条消息) 知识蒸馏技术(教师学生模型) - 知乎

(59 封私信 / 30 条消息) 深度学习高温蒸馏:Softmax With Temperature - 知乎

1. Logits(未归一化;非概率)

Logits 是深度学习模型预测过程中最后一层输出的原始值。它们通常是一个未归一化的实数向量,每个值对应一个类别。Logits 的取值范围可以是正数、负数,甚至非常大或非常小的值。

Logits 是模型预测的中间结果。它们本身并非最终的预测值,而需要通过激活函数(如 Softmax)进行归一化,转化为概率分布。模型的优化目标(如交叉熵损失)直接基于 Logits 或其归一化结果进行计算。

2. softmax输出(归一化后;概率):Softmax 是一个将 Logits 转化为概率分布的激活函数

1常规softmax

2带温度的softmax

其中T是softmax函数的温度超参数。

引入T的原因:使用softmax会将一个差别不大的输出变成很极端的分布,引入温度系数后softmax的soft程度变成可以调节的超参数。T越高,softmax的output probability distribution越趋于平滑,其分布的熵越大,负标签携带的信息会被相对地放大,模型训练将更加关注负标签。

3. 为什么模型输出最好加上softmax,而当使用交叉熵作为损失函数时不用加:

  • 不加softmax输出的不是概率,Logits数据可能为负数;
  • 大多数深度学习框架(如 PyTorch、TensorFlow)中的交叉熵损失函数内部已经包含了 softmax 的计算
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/10 7:57:02

喜马拉雅下载工具:三步实现音频内容本地存储

还在为喜马拉雅音频内容无法离线收听而烦恼吗?这款基于Go语言和Qt5技术开发的音频下载工具,能够轻松实现内容保存,让你将心爱的有声小说、课程资源一键下载到本地永久珍藏!🎧 【免费下载链接】xmly-downloader-qt5 喜马…

作者头像 李华
网站建设 2026/5/20 10:52:08

BrainMapper神经影像分析:从入门到精通的5大核心功能解析

BrainMapper神经影像分析:从入门到精通的5大核心功能解析 【免费下载链接】neurosynth Neurosynth core tools 项目地址: https://gitcode.com/gh_mirrors/ne/neurosynth BrainMapper作为一款强大的Python脑成像分析工具,专门为神经科学研究人员设…

作者头像 李华
网站建设 2026/5/11 14:20:40

【干货收藏】告别Agent“失忆“:生产级Agentic AI系统的九大黄金法则

构建生产级Agentic AI系统需要系统化的软件工程实践,而非简单提示词工程。文章基于Old Dominion大学研究,提出九大黄金法则:工具调用优于MCP、直接函数优于Agent工具、单一职责原则、外部化Prompt管理、多模型联盟等。通过播客生成系统案例展…

作者头像 李华
网站建设 2026/5/17 4:00:04

Font Awesome 手势图标

Font Awesome 提供了丰富的手势(Hands/Gestures)相关图标,主要集中在“Hands”分类中。这些图标常用于表示点赞、指向、胜利手势、石头剪刀布等场景(最新版本 Font Awesome 6)。 常见手势图标列表: Thumb…

作者头像 李华
网站建设 2026/5/13 5:24:32

快速上手LiteLoaderQQNT插件开发:从零创建个性化主题

快速上手LiteLoaderQQNT插件开发:从零创建个性化主题 【免费下载链接】LiteLoaderQQNT LiteLoaderQQNT - QQNT的插件加载器,允许用户为QQNT添加各种插件以扩展功能,如美化主题。 项目地址: https://gitcode.com/gh_mirrors/li/LiteLoaderQQ…

作者头像 李华