2025_NIPS_Analyzing Vision Transformers for Image Classification in Class Embedding Space-平芜编程栈

一、文章主要内容总结

该研究聚焦视觉Transformer（ViT）的机制可解释性，提出了一种通过将ViT中间表示和参数矩阵投影到类嵌入空间的框架，以揭示其图像分类任务中类别表征的构建过程。核心内容包括：

核心方法：借鉴NLP中Transformer的解释思路，将ViT各层隐藏状态（图像token和[CLS]token）及参数矩阵投影到训练过程中学习的类嵌入空间，通过“类可识别性分数”量化中间表示与类原型的对齐程度。
关键发现：
- 图像token从模型早期阶段就开始逐步对齐类原型，且其类别表征的发展依赖注意力机制和上下文信息，与[CLS]token无关；
- 自注意力层和MLP层通过“键-值记忆对”机制差异化贡献于类别表征：自注意力层更早产生分散且组合式的更新，MLP层在后期产生更强、更具预测性的类别更新；
- 类标记区域的图像token更早形成明确类别表征，但上下文区域的token可通过注意力机制从类标记区域获取信息，甚至仅依赖上下文就能构建类别表征；
应用价值：
- 可解释性：通过梯度方法定位图像中对类别检测关键的区域，支持按层和注意力头可视化；
- 优势验证：相比传统线性探测方法，该框架更高效（仅需一次前向传播）、更精准（直接对齐模型自身的类原型，而非无关特征）。

二、文章创新点<

汉知宝企业知识产权管理软件｜多项版权见证创新实力

为更好地服务全国企业用户，助力企业实现高效、便捷的知识产权案件管理，汉知宝科技始终坚持自主创新，研发了一系列高效、实用且显著节约人力成本的知识产权管理方法与系统，并申请了多项知识产权，涵盖11项专利、27项软件…

李华

Codex接入第三方API报错403 Forbidden Country region or territory not supported解决方法

Codex接入第三方API报错403 Forbidden Country region or territory not supported解决方法 SEO关键词：Codex接入第三方API、Codex报错403 Forbidden、Failed to refresh token、Country region or territory not supported、Codex第三方API配置、auth.json配置教程…

李华

【Excel提效 No.086】一句话搞定把表格内容转换成其他格式

目录你是否也遇到过这些问题 1. 前置准备 2. 超简单AI自动化解决方案第1步：准备好你的原始数据第2步：针对指定的文件下达指令第3步：验收更多格式转换模式模式一：Markdown格式转换（本文主方案）模式二：JSON格式转换模式三：HTML格式转换模式四：SQL格式转换资源…

李华

新手必看：用Keil5给C51单片机写第一个按键程序，点亮你的LED灯

从零玩转C51单片机：Keil5环境下的按键控制LED实战指南第一次接触单片机编程时，那种既兴奋又忐忑的心情我至今记忆犹新。看着开发板上闪烁的LED，却不知道如何让它听从自己的指令；面对Keil5复杂的界面，连最基本的工程创建…

李华

SAP PP工艺路线Routing实战：从CA01创建到工序指派，一个完整生产流程的配置详解

SAP PP工艺路线Routing实战：从CA01创建到工序指派，一个完整生产流程的配置详解在制造业数字化转型的浪潮中，SAP PP模块作为生产计划与执行的核心枢纽，其工艺路线（Routing）配置的精准度直接决定了生产流程的…

李华

Windows下免安装运行的DPLL SAT求解器，带数独自动转换与求解功能

本文还有配套的精品资源，点击获取简介：直接双击就能用的命令行工具，基于纯C实现，不依赖任何外部库。输入标准CNF格式文件，快速判断布尔公式是否可满足，并输出一组满足赋值或明确提示不可满足&#xff1…

李华