时间序列平稳性：从Dickey-Fuller到KPSS，双检验实战解读与选型指南-平芜编程栈

时间序列平稳性：从Dickey-Fuller到KPSS，双检验实战解读与选型指南

在金融预测、销售分析或工业设备监控中，时间序列模型的准确性往往取决于一个关键前提——数据是否平稳。但现实中，我们常陷入这样的困境：ADF检验显示平稳的数据，模型预测却依然失真；或两个检验结论直接冲突，让人无从下手。本文将带您穿透统计量的表象，理解两种主流检验方法背后的哲学差异，并构建一套能应对复杂场景的决策框架。

1. 平稳性检验的底层逻辑冲突

1.1 ADF检验的"有罪推定"思维

ADF检验（Augmented Dickey-Fuller Test）采用典型的假设检验范式：

# Python中ADF检验的典型实现 from statsmodels.tsa.stattools import adfuller result = adfuller(series, autolag='AIC') print(f'ADF Statistic: {result[0]:.4f}') print(f'p-value: {result[1]:.4f}')

其原假设（H₀）激进地假定序列存在单位根（即非平稳），这种"宁可错杀"的设定带来三个关键特征：

检验统计量为负值：越负越倾向于拒绝原假设
临界值均为负数：-3.43（1%）、-2.86（5%）、-2.57（10%）
p值阈值：当p<0.05时通常认为平稳

但问题在于，ADF检验本质上检测的是差分平稳性——即序列是否需要通过差分运算才能达到平稳状态。

1.2 KPSS检验的"无罪推定"哲学

KPSS检验（Kwiatkowski-Phillips-Schmidt-Shin Test）则完全相反：

from statsmodels.tsa.stattools import kpss result = kpss(series, regression='c') # 'c'表示仅截距项 print(f'KPSS Statistic: {result[0]:.4f}') print(f'p-value: {result[1]:.4f}')

其原假设（H₀）认为序列是趋势平稳的，这种保守设定导致：

特征	ADF检验	KPSS检验
原假设	非平稳	平稳
备择假设	平稳	非平稳
统计量方向	负向显著	正向显著
检测目标	差分平稳性	趋势平稳性

这种根本性的方法论差异，正是两种检验结果可能冲突的根源。

2. 四种结论组合的实战解析

2.1 案例数据集特征

我们分析某跨境电商平台36个月的智能手表销售数据，呈现明显季节性波动和趋势变化：

import pandas as pd data = pd.read_csv('smartwatch_sales.csv', parse_dates=['month'], index_col='month') print(data.describe()) # 输出示例 """ count 36.000000 mean 482.638889 std 206.214735 min 120.000000 25% 315.000000 50% 480.000000 75% 650.000000 max 890.000000 """

2.2 检验结果组合矩阵

对原始序列和其一阶差分分别进行检验，可能出现四种典型情况：

组合类型	ADF结果	KPSS结果	真实含义	处理方案
类型1	平稳	平稳	严格平稳	直接建模
类型2	非平稳	非平稳	双重非平稳	需差分+趋势消除
类型3	非平稳	平稳	趋势平稳	去除趋势项
类型4	平稳	非平稳	差分平稳	使用差分序列

业务经验提示：类型3和类型4最易被误判。当ADF的p值为0.06（接近临界值）而KPSS显著时，应优先相信KPSS结论。

2.3 类型3的典型处理流程

对于"ADF非平稳 + KPSS平稳"的情况，推荐以下标准化操作：

趋势拟合：使用线性或多项式回归拟合趋势成分

from sklearn.linear_model import LinearRegression X = np.arange(len(data)).reshape(-1, 1) trend_model = LinearRegression().fit(X, data) trend = trend_model.predict(X)

去趋势处理：原序列减去趋势成分
```
detrended = data['sales'] - trend
```
二次验证：对去趋势后的序列重新检验
模型选择：在ARIMA模型中添加确定性趋势项

3. 检验参数的深度调优策略

3.1 ADF检验的滞后阶数选择

ADF检验中autolag参数的三种优化方法对比：

方法	原理	适用场景	实现代码示例
AIC准则	平衡拟合优度与复杂度	中等长度序列（n>100）	`autolag='AIC'`
BIC准则	更强惩罚项防止过拟合	短序列（n<50）	`autolag='BIC'`
固定滞后	基于自相关函数确定	已知明显季节性	`maxlag=12`（按月数据）

3.2 KPSS检验的回归类型选择

KPSS的regression参数决定趋势检测的严格程度：

'c'：仅含截距项（检测水平平稳性）
```
kpss(series, regression='c') # 默认设置
```

'ct'：包含截距和线性趋势项

kpss(series, regression='ct') # 更严格的检验

量化研究建议：金融时间序列建议使用'ct'，销售数据可先用'c'快速筛查。

4. 行业场景下的检验选型指南

4.1 高频交易数据

特征：微观结构噪声大，局部波动显著

优先检验：KPSS（regression='ct'）
参数建议：maxlag=5（避免过度差分）
典型错误：对秒级数据直接使用ADF检验

4.2 零售销售数据

特征：强季节性和促销影响

组合策略：

先进行季节性差分
对残差序列实施ADF+KPSS双检验

from statsmodels.tsa.seasonal import seasonal_decompose result = seasonal_decompose(data, model='additive', period=12) resid = result.resid.dropna()

4.3 工业传感器数据

特征：存在突变点和状态切换

预处理步骤：
- 使用滑动窗口检验（Windowed ADF）
- 结合CUSUM算法检测结构变化
```
from statsmodels.tsa.statespace.tools import cusum_squares css = cusum_squares(data)
```

在实际项目中，我们常发现销售数据的月度增长率通过ADF检验（p=0.02），但KPSS却拒绝平稳性（p<0.01）。这时更合理的做法是采用局部平稳模型，而非强行差分。这种细微的决策差异，往往使预测效果的MSE相差30%以上。

时间序列平稳性：从Dickey-Fuller到KPSS，双检验实战解读与选型指南