news 2026/4/25 17:21:14

Autoformer: Decomposition Transformers with Auto-Correlation for Long-Term Series Forecasting

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Autoformer: Decomposition Transformers with Auto-Correlation for Long-Term Series Forecasting

Autoformer的核心:基于周期的依赖发现(Period-based dependencies)

时间序列通常有周期性(比如交通流的日周期、周周期)。处于“相同相位”的子序列(比如“这周五晚高峰”和“上周五晚高峰”)在形状上是高度相似的。我们的目标不是去关注所有历史数据,而是把注意力集中在那些与当前时刻处于同一相位的历史片段上。

自相关公式(RXX(τ)R_XX(\tau)RXX(τ)):
RXX(τ)=lim⁡L→∞1L∑t=1LXtXt−τ \mathcal{R}_{\mathcal{XX}}(\tau) = \lim_{L \to \infty} \frac{1}{L} \sum_{t=1}^{L} \mathcal{X}_t \mathcal{X}_{t-\tau}RXX(τ)=LlimL1t=1LXtXtτ
τ\tauτ(Time Lag/Delay):这是一个滑动窗口的步长, 测试序列与其自身延迟了τ\tauτ步后的版本之间的关系。∑t=1LXtXt−τ\sum_{t=1}^{L} \mathcal{X}_t \mathcal{X}_{t-\tau}t=1LXtXtτ是衡量两个序列的相似度,如果序列在滞后τ\tauτ时发生了重合(比如τ=24\tau=24τ=24小时),波峰对波峰,波谷对波谷,乘积均为正,总和(R\mathcal{R}R)就会非常大。如果τ\tauτ不是周期(比如τ=13\tau=13τ=13小时),波峰对波谷,正负相消,总和(R\mathcal{R}R)就会趋近于 0。R(τ)\mathcal{R}(\tau)R(τ)的值越大,说明τ\tauτ这个周期越“真实”,我们越应该信赖在这个滞后长度下的历史信息。

使用方式: 当计算出所有可能的**τ\tauτ对应的R(τ)\mathcal{R}(\tau)R(τ),从中只挑选出R(τ)\mathcal{R}(\tau)R(τ)最大的前k**(Top-K)个τ\tauτ, 根据R(τ)\mathcal{R}(\tau)R(τ)的大小,对找到的历史子序列进行加权置信度越高该周期的信息在预测未来时所占的权重就越大

Autoformer的核心:时延信息聚合(Time delay aggregation)

为了实现序列级连接,我们需要将相似的子序列信息进行聚合。它使用Roll()操作替代传统的点对点矩阵。

在标准的 Self-Attention 中,我们通过计算QKTQK^TQKT来让每一个 Token 去“寻找”其他相关的 Token。 而在 Autoformer 中,既然我们已经计算出了最强的kkk个周期滞后τ1,…,τk\tau_1, \dots, \tau_kτ1,,τk(比如昨天、上周、上个月),我们就需要把这些历史时刻的数据**“搬运”**到当前时刻来进行融合。

Roll 操作的物理含义:Roll(V,τ)Roll(V, \tau)Roll(V,τ)的意思是将整个序列VVV向右平移τ\tauτ个时间步。目的是把过去的数据搬运到当前的索引位置上
AutoCorrelation(Q,K,V)=∑i=1kRoll(V,τi)R^Q,K(τi) \text{AutoCorrelation}(\mathcal{Q,K,V}) = \sum_{i=1}^{k} \text{Roll}(\mathcal{V}, \tau_i) \hat{\mathcal{R}}_{\mathcal{Q,K}}(\tau_i)AutoCorrelation(Q,K,V)=i=1kRoll(V,τi)R^Q,K(τi)
基于选择的周期性最强的k个进行聚合,将所有平移并加权后的序列叠加起来,得到最终的输出。实际上是在做多周期的特征融合

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/17 19:56:28

Leetcode 80 统计一个数组中好对子的数目

1 题目 1814. 统计一个数组中好对子的数目 给你一个数组 nums ,数组中只包含非负整数。定义 rev(x) 的值为将整数 x 各个数字位反转得到的结果。比方说 rev(123) 321 , rev(120) 21 。我们称满足下面条件的下标对 (i, j) 是 好的 : 0 &l…

作者头像 李华
网站建设 2026/4/23 4:55:56

Linux 笔记:rpm命令

Linux 中 RPM 命令详解RPM(Red Hat Package Manager)是 Red Hat 及其衍生发行版(如 CentOS、Fedora 等)中用于安装、卸载、查询和管理软件包的工具。基本语法rpm [选项] 包名安装软件包rpm -i 包文件名-i:表示安装&…

作者头像 李华
网站建设 2026/4/15 21:19:27

提示工程架构师如何用“用户反馈循环”优化提示内容,提升体验?

提示工程架构师如何用「用户反馈循环」优化提示内容:从痛点到闭环的全流程指南 一、引言:为什么提示优化需要「用户反馈循环」? 1. 提示工程的「隐形痛点」:你写的提示,用户真的能用吗? 作为提示工程架构师…

作者头像 李华
网站建设 2026/4/18 17:10:35

前端工程化面试题,零基础入门到精通,收藏这篇就够了

一、HTML 常见题目 01、Doctype作用?严格模式与混杂模式如何区分?它们有何意义? 02、HTML5 为什么只需要写 ? 03、行内元素有哪些?块级元素有哪些? 空(void)元素有那些? 04、页面导入样式时&#xff0…

作者头像 李华
网站建设 2026/4/23 15:45:30

Kotaemon能否用于宠物护理建议?兽医知识普及场景

Kotaemon在宠物护理与兽医知识普及中的应用探索 当一只猫咪连续三天不吃不喝,主人往往手足无措:是该立刻冲向急诊,还是先观察一晚?网络搜索出来的答案五花八门,真假难辨;电话咨询兽医又担心小题大做、浪费资…

作者头像 李华
网站建设 2026/4/23 16:34:59

聊聊阶梯碳下考虑P2G - CCS与供需灵活响应的IES优化调度

115-自己编写完全复献可-阶梯碳下考虑P2G-CCS与供需灵活响应的IES优化调度-完全复现场景10 matlabyalmipcplex 主要内容:首先考虑氢能参与 IES 实现降碳减排并引入阶梯式碳机制进一步约束碳排放,然后考虑 P2G-CCS(power to gas and carbon capture syste…

作者头像 李华