news 2026/3/11 1:05:06

【Python时序预测系列】建立CNN-LSTM-Transformer融合模型实现多变量时序预测(案例+源码)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【Python时序预测系列】建立CNN-LSTM-Transformer融合模型实现多变量时序预测(案例+源码)

这是我的第449篇原创文章。

一、引言

CNN(卷积)擅长抓“局部模式”,LSTM(长短时记忆网络)擅长记住“时间上的因果和长期依赖”,Transformer(自注意力)擅长把序列里任意两个时刻相互比较、找全局相关性,而且能并行处理。

融合方式:串联
CNN → LSTM → Transformer。先提取局部特征,再用 LSTM 建长期状态,最后用 Transformer 做全局交互。

下面通过一个具体的案例,融合CNN + LSTM + Transformer进行多变量输入单变量输出单步时间序列预测,包括模型构建、训练、预测等等。

二、实现过程

2.1 数据加载

核心代码:

df = pd.read_csv('data.csv', parse_dates=["Date"], index_col=[0]) df = pd.DataFrame(df)

结果:原始数据集总数5203

2.2 数据划分

核心代码:

test_split=round(len(df)*0.20) df_for_training=df[:-test_split] df_for_testing=df[-test_split:]

训练集:4162,测试集:1041

2.3 数据归一化

核心代码:

scaler = MinMaxScaler(feature_range=(0,1)) df_for_training_scaled = scaler.fit_transform(df_for_training) df_for_testing_scaled=scaler.transform(df_for_testing)

2.4 构造时序数据集

核心代码:

train_dataset = TimeSeriesDataset(df_for_training_scaled, seq_len=30, pred_len=1) test_dataset = TimeSeriesDataset(df_for_testing_scaled, seq_len=30, pred_len=1) train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True) test_loader = DataLoader(test_dataset, batch_size=batch_size, shuffle=False)

时序训练集和测试集数组形状:

2.5 CNN_LSTM_Transformer模型

核心代码:

class CNN_LSTM_Transformer(nn.Module): def __init__(self, input_dim=5, cnn_channels=16, lstm_hidden=32, transformer_dim=32, transformer_heads=4, transformer_layers=1, pred_len=1): super().__init__() # CNN self.cnn = nn.Conv1d(in_channels=input_dim, out_channels=cnn_channels, kernel_size=3, padding=1) self.cnn_relu = nn.ReLU() # LSTM self.lstm = nn.LSTM(input_size=cnn_channels, hidden_size=lstm_hidden, batch_first=True) # Transformer Encoder encoder_layer = nn.TransformerEncoderLayer(d_model=transformer_dim, nhead=transformer_heads, batch_first=True) self.transformer = nn.TransformerEncoder(encoder_layer, num_layers=transformer_layers) # Projection layers self.proj_lstm = nn.Linear(lstm_hidden, transformer_dim) self.pred_len = pred_len self.fc_out = nn.Linear(transformer_dim, pred_len) def forward(self, x): # x: [batch, seq_len, 1] batch_size, seq_len, _ = x.shape # CNN expects [batch, channels, seq_len] cnn_out = self.cnn_relu(self.cnn(x.transpose(1,2))) # [B, C, T] cnn_out = cnn_out.transpose(1,2) # [B, T, C] # LSTM lstm_out, _ = self.lstm(cnn_out) # [B, T, hidden] lstm_proj = self.proj_lstm(lstm_out) # [B, T, transformer_dim] # Transformer trans_out = self.transformer(lstm_proj) # [B, T, transformer_dim] # 取最后时间步输出预测 out = self.fc_out(trans_out[:, -1, :]) # [B, pred_len] return out.unsqueeze(-1) # [B, pred_len, 1]

2.6 训练模型

核心代码:

def train_model(model, dataloader, num_epochs=50, learning_rate=1e-3, device='cpu'): optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate) criterion = nn.MSELoss() model.train() loss_history = [] for epoch in range(num_epochs): epoch_losses = [] for batch_data, batch_targets in dataloader: batch_data = batch_data.to(device) batch_targets = batch_targets.to(device) optimizer.zero_grad() outputs = model(batch_data) loss = criterion(outputs, batch_targets) loss.backward() optimizer.step() epoch_losses.append(loss.item()) avg_loss = np.mean(epoch_losses) loss_history.append(avg_loss) if (epoch + 1) % 10 == 0: print(f"Epoch [{epoch + 1}/{num_epochs}], Loss: {avg_loss:.4f}") return loss_history

结果:

2.7 模型测试集评估

核心代码:

def evaluate_model(model, dataloader, device='cpu'): model.eval() preds = [] trues = [] with torch.no_grad(): for batch_data, batch_targets in dataloader: batch_data = batch_data.to(device) outputs = model(batch_data) preds.append(outputs.cpu().numpy()) trues.append(batch_targets.cpu().numpy()) preds = np.concatenate(preds, axis=0).squeeze() trues = np.concatenate(trues, axis=0).squeeze() return preds, trues

2.8 结果可视化

核心代码:

def visualize_results(loss_history, preds, trues): sns.set(font_scale=1.2) plt.rc('font', family=['Times New Roman', 'Simsun'], size=12) # 图 1:训练损失曲线 # 模型在训练过程中损失的下降情况,说明模型不断优化拟合数据。 plt.plot(loss_history, marker='o', color='dodgerblue', linestyle='-', linewidth=2) plt.title("Training Loss Curve") plt.xlabel("Epoch") plt.ylabel("MSE Loss") plt.tight_layout() plt.savefig('output_image1.png', dpi=300, format='png') plt.show() # 图 2:真实值与预测值对比曲线 # 对比曲线直观展示模型预测趋势与真实数据的匹配情况,越接近表示模型效果越好。 plt.plot(trues, label="True Values", color='limegreen') plt.plot(preds, label="Predicted Values", color='crimson') plt.title("True vs. Predicted Values") plt.xlabel("Sample Index") plt.ylabel("Trend Value") plt.legend() plt.tight_layout() plt.savefig('output_image2.png', dpi=300, format='png') plt.show()

图 1:训练损失曲线

图 2:真实值与预测值对比曲线

2.9 计算误差

核心代码:

testScore1 = math.sqrt(mean_squared_error(preds_test, trues_test)) print('Test Score: %.2f RMSE' % (testScore1)) testScore2 = mean_absolute_error(preds_test, trues_test) print('Test Score: %.2f MAE' % (testScore2)) testScore3 = r2_score(preds_test, trues_test) print('Test Score: %.2f R2' % (testScore3)) testScore4 = mean_absolute_percentage_error(preds_test, trues_test) print('Test Score: %.2f MAPE' % (testScore4))

结果:

作者简介:

读研期间发表6篇SCI数据挖掘相关论文,现在某研究院从事数据算法相关科研工作,结合自身科研实践经历不定期分享关于Python、机器学习、深度学习、人工智能系列基础知识与应用案例。致力于只做原创,以最简单的方式理解和学习,关注我一起交流成长。需要数据集和源码的小伙伴可以关注底部公众号添加作者微信。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/10 23:44:48

BRC-200控制器板

BRC-200 控制器板BRC-200 是一款用于工业自动化系统中的 控制器板,主要承担系统核心控制、逻辑运算与数据处理任务,常作为控制系统的主控单元或智能控制节点使用。主要功能与特点:作为系统核心控制单元,执行控制逻辑与运算任务支持…

作者头像 李华
网站建设 2026/3/4 4:17:37

鼎捷ERP和MES系统集成方案详解,如何实现现有软件无缝对接?

某汽车零部件制造商通过上述方法将ERP与MES系统对接后,生产数据流转效率提升40%;某零售电商平台整合订单与仓储系统,使订单处理时长缩短至500毫秒内,错误率下降至0.01%。为实现新系统与既有架构的平滑集成,应基于业务流…

作者头像 李华
网站建设 2026/3/10 20:05:08

【课程设计/毕业设计】基于协同过滤推荐算法的线上安全教育平台设计与实现基于springboot+协同过滤课程推荐的线上安全教育平台【附源码、数据库、万字文档】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/3/4 1:34:07

SPEC CODING实战:构建高性能微服务架构

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 在快马平台上开发一个微服务示例项目,展示SPEC CODING在实际开发中的应用。项目包括用户认证、订单处理和支付三个微服务,要求使用Spring Boot和Docker容器…

作者头像 李华
网站建设 2026/3/9 14:28:02

5分钟创建SysML原型:快马平台极速体验

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 在快马平台上快速创建一个无人机系统的SysML原型,要求:1.在5分钟内生成可运行的基本框架;2.包含飞行控制、导航和通信三个主要模块;…

作者头像 李华
网站建设 2026/3/4 1:34:12

效率翻倍:告别手动敲nbsp;的5个现代方案

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个HTML空格批量处理工具,功能包括:1. 粘贴HTML代码自动分析 2. 智能识别需要保留空格的位置 3. 批量替换普通空格为 4. 支持正则表达式自定义规则 5…

作者头像 李华