news 2026/5/30 13:15:06

2025.12.28日周报

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
2025.12.28日周报

12.28日周报

  • 一、文献阅读
    • 题目信息
    • 摘要
    • 创新点
    • 网络框架
      • 1. ConvLSTM 单元结构
      • 2. 编码器-预测器模型
    • 实验
      • 实验一:Moving MNIST 数据集
      • 实验二:雷达回波数据集
    • 结论
    • 不足与展望

一、文献阅读

题目信息

题目:《Convolutional LSTM Network: A Machine Learning Approach for Precipitation Nowcasting》
期刊/会议:NIPS 2015 (Advances in Neural Information Processing Systems)
作者:Xingjian Shi, Zhourong Chen, Hao Wang, Dit-Yan Yeung, Wai-kin Wong, and Wang-chun Woo
发表时间:2015
文章链接:https://arxiv.org/abs/1506.04214

摘要

本文针对降水临近预报这一极具挑战性的天气预报问题,提出了一种基于机器学习的解决方案。作者将降水临近预报建模为一个时空序列预测问题,即输入和预测目标均为时空序列。为了克服传统全连接长短期记忆网络无法有效提取空间特征的局限性,提出了卷积LSTM。通过将LSTM内部的状态到状态、输入到状态的转换操作由全连接改为卷积操作,ConvLSTM能够同时建立时间与空间的相关性模型。实验结果表明,ConvLSTM在合成的Moving MNIST数据集和真实的雷达回波数据集上,均能比FC-LSTM和当时的业务算法更好地捕捉时空相关性,显著提升了预报准确率。

创新点

  1. 提出了卷积LSTM网络架构,传统的FC-LSTM在处理图像序列时需要将二维数据展平为一维向量,导致空间信息丢失。ConvLSTM通过在输入-状态和状态-状态的转换中引入卷积操作,使得模型能够保留输入数据的空间结构,从而同时提取时间及空间特征。
  2. 将降水临近预报形式化为时空序列预测问题,不同于传统的基于光流法的方法,本文是一个端到端的可训练深度学习模型,直接从雷达回波图序列学习降水的演变规律。
  3. 设计了编码器-预测器结构,借鉴了机器翻译中的seq2seq模型,构建了由ConvLSTM堆叠而成的编码器网络和预测器网络,前者用于压缩历史时空信息,后者用于生成未来的预测序列。

网络框架

1. ConvLSTM 单元结构

ConvLSTM 是全连接 LSTM 的扩展。
在 ConvLSTM 中,所有的输入X t X_tXt、细胞输出C t C_tCt、隐藏状态H t H_tHt和门控信号(i t , f t , o t i_t, f_t, o_tit,ft,ot)都是三维张量,其最后两个维度为空间维度(行和列)。
核心公式中的矩阵乘法被替换为卷积操作
其中,∗ *表示卷积,∘ \circ表示哈达玛积:i t = σ ( W x i ∗ X t + W h i ∗ H t − 1 + W c i ∘ C t − 1 + b i ) f t = σ ( W x f ∗ X t + W h f ∗ H t − 1 + W c f ∘ C t − 1 + b f ) C t = f t ∘ C t − 1 + i t ∘ tanh ⁡ ( W x c ∗ X t + W h c ∗ H t − 1 + b c ) o t = σ ( W x o ∗ X t + W h o ∗ H t − 1 + W c o ∘ C t + b o ) H t = o t ∘ tanh ⁡ ( C t ) \begin{aligned} i_t &= \sigma(W_{xi} * \mathcal{X}_t + W_{hi} * \mathcal{H}_{t-1} + W_{ci} \circ \mathcal{C}_{t-1} + b_i) \\ f_t &= \sigma(W_{xf} * \mathcal{X}_t + W_{hf} * \mathcal{H}_{t-1} + W_{cf} \circ \mathcal{C}_{t-1} + b_f) \\ \mathcal{C}_t &= f_t \circ \mathcal{C}_{t-1} + i_t \circ \tanh(W_{xc} * \mathcal{X}_t + W_{hc} * \mathcal{H}_{t-1} + b_c) \\ o_t &= \sigma(W_{xo} * \mathcal{X}_t + W_{ho} * \mathcal{H}_{t-1} + W_{co} \circ \mathcal{C}_t + b_o) \\ \mathcal{H}_t &= o_t \circ \tanh(\mathcal{C}_t) \end{aligned}itftCtotHt=σ(WxiXt+WhiHt1+WciCt1+bi)=σ(WxfXt+WhfHt1+WcfCt1+bf)=ftCt1+ittanh(WxcXt+WhcHt1+bc)=σ(WxoXt+WhoHt1+WcoCt+bo)=ottanh(Ct)

展示了输入数据和状态在 LSTM 单元内部的处理流程,核心区别在于使用了卷积操来处理二维空间数据,而非传统的全连接乘法。

2. 编码器-预测器模型

为了进行多步预测,模型采用了类似于seq2seq的结构。
编码网络:由多层ConvLSTM组成,接收历史序列输入,将其压缩为隐藏状态张量。
预测网络:同样由多层 ConvLSTM 组成,利用编码网络的最终状态作为初始状态,逐步生成未来的预测帧。
网络结构是左侧为编码路径,输入历史雷达图;右侧为预测路径,输出未来雷达图。
两个网络均由堆叠的ConvLSTM层构成

实验

作者在两个数据集上进行了实验:合成的Moving MNIST数据集和真实的雷达回波数据集。

实验一:Moving MNIST 数据集

该实验旨在验证模型学习简单时空移动规律的能力。数据集由两个在黑色背景上反弹的移动数字组成。
ConvLSTM相比FC-LSTM能够更清晰地预测出数字的移动轨迹和形状,FC-LSTM的预测结果不仅模糊,而且难以捕捉复杂的重叠运动。ConvLSTM尤其是多层结构,如3层表现最佳。

实验二:雷达回波数据集

使用香港天文台提供的雷达回波数据,包含97个雨天的记录。任务是根据过去5帧预测未来15帧。
预测指标为:降雨率均方误差 (MSE)、CSI (Critical Success Index)、FAR (False Alarm Rate)、POD (Probability of Detection)。

ConvLSTM 在各项指标上均优于 FC-LSTM 和当时业务上使用的基于光流法的ROVER算法。特别是在较长时效的预测中,ConvLSTM的优势更加明显,能够保持较好的降水结构。

结论

本文提出了ConvLSTM架构,用于解决降水临近预报问题。通过将卷积结构引入LSTM,该模型成功克服了传统RNN丢失空间信息的缺陷,能够有效地建立时空序列的相关性模型。实验证明,ConvLSTM在处理包含复杂时空变化的数据时,表现优于全连接LSTM和传统的非机器学习方法,为气象领域的时空序列预测提供了一个强大的基准模型。

不足与展望

虽然比FC-LSTM好,但在长时预测中,ConvLSTM生成的图像仍然会趋于模糊。这主要是由于使用了均方误差作为损失函数,导致模型倾向于输出平均化的结果。未来可以考虑引入生成对抗网络或更感知的损失函数来提升清晰度;相比FC-LSTM,卷积操作的计算开销较大,训练和推理速度相对较慢;目前的模型纯粹是数据驱动的,未结合大气动力学方程。未来的研究可以探索将物理约束融入网络设计或损失函数中,以提高预测的物理一致性。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/20 17:37:30

法律文书智能生成:基于TensorRT优化的专用推理服务

法律文书智能生成:基于TensorRT优化的专用推理服务 在司法系统数字化转型加速的今天,律师和法官每天要处理大量重复性文书工作——从起诉状、答辩书到合同审查意见。传统人工撰写不仅耗时,还容易因格式或条款疏漏引发争议。近年来&#xff0c…

作者头像 李华
网站建设 2026/5/29 22:58:07

开发者生态建设:围绕TensorRT构建技术社区的思考

开发者生态建设:围绕TensorRT构建技术社区的思考 在当今AI应用加速落地的时代,一个耐人寻味的现象是:许多团队能在几天内训练出高精度模型,却要花上几周甚至几个月才能把它们稳定部署到生产环境。这背后的核心瓶颈之一&#xff0c…

作者头像 李华
网站建设 2026/5/21 0:56:06

高校AI教学实验平台建设:基于TensorRT的标准镜像分发

高校AI教学实验平台建设:基于TensorRT的标准镜像分发 在高校人工智能课程日益普及的今天,一个令人头疼的问题反复出现:学生在实验室跑通的模型,换一台机器就报错;训练好的网络部署到边缘设备时延迟高得无法接受&#x…

作者头像 李华
网站建设 2026/5/29 12:40:31

打造高性能RAG系统:检索+生成全流程TensorRT加速

打造高性能RAG系统:检索生成全流程TensorRT加速 在企业级智能问答、知识库助手等实时交互场景中,用户对响应速度的要求越来越高。一个看似简单的“提问-回答”过程背后,往往依赖复杂的AI推理链路——尤其是基于检索增强生成(RAG&a…

作者头像 李华
网站建设 2026/5/23 16:30:25

基于ARMCortex-M4F内核的MSP432MCU开发实践【3.1】

2.主模式 通过设置UCMODEx=11、USCYNC=1,置位UCMST控制位,eUSCI_B模块将被配置为I2C主模式。若当前主机是多主机系统的一部分时,必须将UCMM置位,并将其自身地址编程写入UCBxI2COA寄存器。UCA10=0时,选择7位寻址模式; UCA10=1时,选择10位寻址模式。UCGCEN控制位选择eUSC…

作者头像 李华
网站建设 2026/5/29 14:33:33

STM32串口DMA与空闲中断联合应用实战案例

STM32串口DMA与空闲中断联合应用实战:如何实现高效、低CPU占用的不定长数据接收?在嵌入式开发中,你是否遇到过这样的场景?多个传感器通过串口持续发送数据,主控MCU却因频繁中断而“卡顿”;接收到的数据总是…

作者头像 李华