news 2026/4/15 7:18:43

基于自回归整合滑动平均模型(ARIMA)的时间序列预测

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
基于自回归整合滑动平均模型(ARIMA)的时间序列预测

基于自回归整合滑动平均模型(ARIMA)的时间序列预测

最近在折腾时间序列预测的项目,发现ARIMA这玩意儿虽然老派但确实能打。今天咱们就抛开教科书上的复杂公式,用实际代码和通俗解释聊聊怎么用它做预测。先扔个结论:ARIMA的核心就是三句话——看历史数据、算差异、纠误差。

先搞个模拟数据试试水。假设我们有个每周销售额的波动数据:

import numpy as np import pandas as pd np.random.seed(42) base = np.linspace(0, 20, 100) trend = 0.5 * np.arange(100) seasonality = 5 * np.sin(2 * np.pi * np.arange(100)/7) noise = np.random.normal(0, 1, 100) ts_data = pd.Series(base + trend + seasonality + noise, index=pd.date_range('2020-01-01', periods=100, freq='D'))

这时候直接上ARIMA肯定翻车,得先看数据是否平稳。划重点:ADF检验才是亲爹:

from statsmodels.tsa.stattools import adfuller result = adfuller(ts_data) print(f'ADF统计量: {result[0]:.3f}') print(f'p值: {result[1]:.3f}') # 输出大概率大于0.05,说明不平稳

如果p值大于0.05,直接进入差分环节。这里有个骚操作——动态差分直到平稳:

diff_count = 0 current_data = ts_data.copy() while True: result = adfuller(current_data.dropna()) if result[1] < 0.05: break current_data = current_data.diff().dropna() diff_count += 1 print(f'需要差分次数: {diff_count}') # 通常1-2次就能搞定

接下来要确定AR和MA的阶数。别被ACF/PACF图搞懵,实战中直接让auto_arima干活更省事:

from pmdarima import auto_arima model = auto_arima(ts_data, seasonal=False, trace=True) # 输出里找AIC最小的组合,比如(2,1,1)

拿到最佳参数后正式建模:

from statsmodels.tsa.arima.model import ARIMA model = ARIMA(ts_data, order=(2,1,1)) results = model.fit() # 重点看系数P值是否小于0.05,否则考虑删减参数 print(results.summary())

预测阶段注意要包含历史数据的类型:

forecast = results.get_forecast(steps=7) # 别直接用predict,要带置信区间 print(forecast.predicted_mean)

踩过几个坑特别提醒:

  1. 遇到周期性数据记得用SARIMA(比如销售数据周循环)
  2. 预测结果出现直线下滑?检查是否差分过度
  3. 样本量小于50条的建议换模型

最后来个可视化收尾:

import matplotlib.pyplot as plt ts_data.plot(label='历史数据') forecast.predicted_mean.plot(label='预测', color='red') plt.fill_between(forecast.conf_int().index, forecast.conf_int()['lower close'], forecast.conf_int()['upper close'], color='pink', alpha=0.3) plt.legend()

ARIMA就像老中医把脉,数据平稳了、参数调准了,预测效果自然就上来了。下次遇到股票价格、服务器负载这些时间序列,不妨先拿它试试手。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/11 12:35:54

Qwen3-VL视频分析实战:云端大显存方案,告别OOM错误

Qwen3-VL视频分析实战&#xff1a;云端大显存方案&#xff0c;告别OOM错误 引言&#xff1a;视频博主的AI分析利器 作为一名视频内容创作者&#xff0c;你是否经常需要分析影视作品中的关键帧、识别场景中的物体、或者提取视频中的文字信息&#xff1f;传统的人工逐帧查看方式…

作者头像 李华
网站建设 2026/4/9 17:19:51

HY-MT1.5新闻翻译应用:多语种内容发布系统搭建步骤

HY-MT1.5新闻翻译应用&#xff1a;多语种内容发布系统搭建步骤 随着全球化进程的加速&#xff0c;跨语言内容传播已成为媒体、企业与政府机构的核心需求。在这一背景下&#xff0c;高质量、低延迟的自动翻译系统成为构建多语种内容发布平台的关键基础设施。腾讯近期开源的混元…

作者头像 李华
网站建设 2026/4/14 10:08:49

Qwen3-VL自动化测试:低成本持续集成方案

Qwen3-VL自动化测试&#xff1a;低成本持续集成方案 引言 作为一名ML工程师&#xff0c;你是否经常遇到这样的困扰&#xff1a;每当Qwen3-VL模型更新后&#xff0c;需要进行全面的回归测试&#xff0c;但自建测试服务器利用率低&#xff0c;闲置时也在烧钱&#xff1f;传统的…

作者头像 李华
网站建设 2026/4/12 14:33:02

JBoltAI4系列新功能解读:Java企业AI开发优化方向

在Java企业级AI应用开发领域&#xff0c;JBoltAI4系列围绕开发者实际需求&#xff0c;从架构、数据处理、开发体验等维度进行功能更新&#xff0c;这些优化并非单纯的技术叠加&#xff0c;而是针对企业AI开发中的常见痛点提供解决方案&#xff0c;下面从几个核心方向展开解读。…

作者头像 李华
网站建设 2026/4/14 6:15:53

Java团队AI智能问数:常见坑点与落地解决方案

Java开发团队投身AI智能问数项目时&#xff0c;往往以为核心难点是算法选型&#xff0c;实际落地后才发现&#xff0c;数据对接、解析、推理等环节的问题更棘手&#xff0c;稍有不慎就会导致项目卡壳。首先是数据接入的“兼容难题”。企业内部数据分散在CRM、ERP等不同系统&…

作者头像 李华
网站建设 2026/4/11 12:15:48

Qwen3-VL模型微调入门:云端GPU+教程,新手3小时掌握

Qwen3-VL模型微调入门&#xff1a;云端GPU教程&#xff0c;新手3小时掌握 引言&#xff1a;为什么选择Qwen3-VL&#xff1f; 作为一名数据科学家&#xff0c;当你需要处理视觉理解任务&#xff08;如图像描述、视觉问答&#xff09;时&#xff0c;Qwen3-VL模型可能是你的理想…

作者头像 李华