news 2025/12/28 11:29:26

YOLOv8改进策略【Conv和Transformer】| CVPR 2023:Super Token Attention 超级令牌注意力机制

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
YOLOv8改进策略【Conv和Transformer】| CVPR 2023:Super Token Attention 超级令牌注意力机制

一、本文介绍

本文记录的是利用Super Token Attention(STA)机制优化YOLOv8的目标检测网络模型

传统视觉Transformer的全局自注意力机制虽能捕捉长程依赖,但计算复杂度与令牌数量呈二次关系,资源占用极大;局部注意力或早期卷积虽降低了计算量,却牺牲了全局建模能力,且浅层存在高冗余。STA借鉴超像素思想,通过稀疏关联学习将视觉令牌聚合为语义紧凑的超令牌,在超令牌空间高效执行自注意力以捕捉全局依赖,再通过令牌上采样映射回原始令牌空间,将复杂的全局注意力分解为稀疏关联图与低维注意力的乘积,实现了高效且有效的全局上下文建模,同时保留局部特征表达能力


专栏目录:YOLOv8改进目录一览 | 涉及卷积层、轻量化、注意力、损失函数、Backbone、SPPF、Neck、检测头等全方位改进

专栏地址:YOLOv8改进专栏——以发表论文的角度,快速准确的找到有效涨点的创新点!

文章目录

  • 一、本文介绍
  • 二、Super Token Attention介绍
    • 2.1 出发点
    • 2.2 原理
    • 2.3 结构
      • 2.3.1 Super Token Sampling (STS)
      • 2.3.2 Multi - Head Self - Attention (MHSA)
      • 2.3.3 Token Upsampling (TU)
    • 2.4 优势
  • 三、Super Token Attention的实现代码
  • 四、创新模块
    • 4.1 改进点1
    • 4.2 改进点2⭐
  • 五、添加步骤
    • 5.1 修改一
    • 5.2 修改二
    • 5.3 修改三
  • 六、yaml模型文件
    • 6.1 模型改进版本一⭐
    • 6.2 模型改进版本二⭐
  • 七、成功运行结果

二、Super Token Attention介绍

Vision Transformer with Super Token Sampling

2.1 出发点

  • Vision transformer在浅层捕获局部特征时可能存在高冗余,局部自注意力或早期卷积的使用会牺牲捕获长程依赖的能力。为了解决在神经网络早期阶段能否进行高效且有效的全局上下文建模这一挑战,受超像素设计的启发,将其引入到Vision transformer中,提出了Super Token Attention模块。

2.2 原理

  • 借鉴超像素减少后续处理中图像基元数量的思想,假设超令牌是视觉内容的一种语义上有意义的细分,从而减少自注意力中的令牌数量并保留全局建模能力。通过稀疏关联学习从视觉令牌中采样超令牌,对超令牌进行自注意力操作,然后将它们映射回原始令牌空间,将普通的全局注意力分解为稀疏关联映射和低维注意力的乘法,从而高效地捕获全局依赖关系。

2.3 结构

  • Super Token Attention模块由三个过程组成,即Super Token Sampling (STS)Multi - Head Self - Attention (MHSA)和<
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2025/12/27 15:59:57

libxml2 XML解析库:鸿蒙PC上的XML处理工具

ohos-libxml2 是为 OpenHarmony 平台编译的 libxml2 XML 解析库。本文档详细介绍如何在鸿蒙PC上安装和使用官方适配完成的 libxml2 库&#xff0c;包括 HNP 包的打包、安装和使用方法。 &#x1f4cb; 目录 一、项目概述二、为什么需要 HNP 包三、HNP 包打包方法四、安装与使用…

作者头像 李华
网站建设 2025/12/26 10:25:25

螺蛳粉鸭脚煲市场深度研究报告:聚焦那巷那螺发展态势与行业趋势

1.1 研究背景与目的螺蛳粉鸭脚煲融合螺蛳粉酸辣鲜爽与鸭脚软糯口感&#xff0c;发源于广西柳州街头&#xff0c;借社交媒体传播从地方小吃走向全国&#xff0c;成为餐饮行业新兴热门品类。本研究旨在剖析该品类市场现状、消费需求及竞争格局&#xff0c;为企业决策提供支持&…

作者头像 李华
网站建设 2025/12/16 16:13:01

Langchain-Chatchat集成MindIE与Xinference实战

Langchain-Chatchat集成MindIE与Xinference实战 在企业级智能问答系统日益普及的今天&#xff0c;如何在保障数据隐私的前提下实现高性能推理&#xff0c;成为技术选型的核心挑战。尤其对于政企客户而言&#xff0c;私有化部署不仅是合规要求&#xff0c;更是业务连续性的关键支…

作者头像 李华
网站建设 2025/12/16 16:12:30

年前可见刊!版面费破天荒$399,只要格式OK基本无返修直录

知网/谷歌期刊作用01学术和职业发展发表知网普刊论文可以帮助学生提高学术能力和研究水平&#xff0c;增加保研和求职的竞争力。02加分和评奖知网普刊论文可以用于加学分、评奖学金、评优评奖等。这对于在校学生来说是一个非常实际的优势&#xff0c;因为这些期刊相对容易发表&…

作者头像 李华
网站建设 2025/12/16 16:11:39

Docker安装TensorRT时挂载GPU设备的权限配置

Docker安装TensorRT时挂载GPU设备的权限配置 在AI模型从实验室走向生产部署的过程中&#xff0c;一个常见的痛点浮出水面&#xff1a;明明在本地能跑得飞快的推理代码&#xff0c;一放进Docker容器就报错“找不到GPU”或者“CUDA初始化失败”。尤其是在使用NVIDIA TensorRT进行…

作者头像 李华
网站建设 2025/12/16 16:10:18

SCI特刊/专刊和正刊的区别?

sci特刊/专刊和正刊的区别&#xff1f;sci专刊&#xff0c;特刊&#xff0c;正刊&#xff0c;增刊有什么区别&#xff1f;下面淘淘论文给大家讲解这个问题。1.正刊所谓正刊&#xff0c;就是在这个期刊正常刊期之内发表的文章&#xff0c;就是正刊发表。这个SCI期刊&#xff0c;…

作者头像 李华