news 2026/4/15 12:23:24

基于小波核卷积与动态路由胶囊网络的旋转机械故障诊断方法(Pytorch)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
基于小波核卷积与动态路由胶囊网络的旋转机械故障诊断方法(Pytorch)

首先从西储大学轴承数据库中加载三种健康状态的振动信号数据(正常、滚珠故障、内圈故障),对原始长信号进行分割、标准化预处理,并按比例划分为训练集和测试集。然后构建小波胶囊网络模型,该模型的核心是小波核卷积层,它使用可训练的Laplace小波核替代传统卷积核,能够从振动信号中提取具有物理意义和可解释性的时频特征;特征经过多层卷积和池化后,输入到胶囊层进行特征聚类,胶囊层采用动态路由算法对特征进行编码,每个胶囊代表一个故障类别的存在概率和特征参数。模型训练阶段使用交叉熵损失函数和Adam优化器,通过反向传播算法更新网络参数,同时采用学习率衰减策略优化训练过程。训练完成后,在测试集上评估模型性能,计算准确率、精确率、召回率等指标,并生成混淆矩阵和分类报告。最后,系统通过多种可视化方法展示模型的可解释性,包括可视化学习到的小波核形状、展示特征图、对比不同故障类别的特征提取效果,以及分析胶囊层的输出概率,从而验证模型从振动信号中学到的特征与故障机理之间的关联性,提高了诊断结果的可信度和可解释性。

第一步:数据准备与预处理

首先从西储大学轴承数据库中加载三种健康状态的振动信号数据文件,包括正常轴承信号、滚珠故障信号和内圈故障信号。对每个长振动信号按照设定的窗口长度和重叠率进行分割,生成固定长度的信号样本片段。对分割后的所有样本进行Z-score标准化处理,使数据均值为0、标准差为1,以加速模型收敛并提高训练稳定性。然后将标准化后的数据随机打乱顺序,按照预设的比例划分为训练集和测试集,确保训练集和测试集中的各类别样本分布均衡。

第二步:构建小波胶囊网络模型

创建小波胶囊网络模型结构,该模型由特征提取器和分类器两部分组成。特征提取器的第一层采用小波核卷积层,使用可训练的Laplace小波函数作为卷积核,这些小波核具有不同的中心频率和阻尼参数,能够从振动信号中提取具有物理意义的时频特征。特征提取器还包括多层传统卷积层、批归一化层、ReLU激活函数和最大池化层,用于进一步提取深层特征并进行特征降维。提取的特征经过重塑后输入到胶囊层,胶囊层采用动态路由算法对特征进行聚类和编码,每个胶囊代表一个故障类别的存在概率和姿态参数,通过Squash激活函数将胶囊向量长度压缩到0-1之间表示概率。最后通过全连接层将胶囊输出转换为最终的故障类别预测。

第三步:模型训练与优化

初始化模型的所有参数,设定训练的超参数如批量大小、学习率、训练轮数等。使用交叉熵损失函数作为优化目标,选择Adam优化器进行参数更新,并设置学习率衰减策略以在训练后期微调参数。训练过程中,每个epoch依次从训练集中取出批次数据,进行前向传播计算预测结果和损失值,然后通过反向传播算法计算梯度,使用优化器更新网络参数。记录每个epoch的训练损失和准确率,定期在测试集上评估模型性能,监控模型的泛化能力,防止过拟合现象的发生。

第四步:模型评估与性能分析

在训练完成后,使用独立的测试集对模型进行全面评估。计算模型在测试集上的总体准确率,以及每个故障类别的精确率、召回率和F1分数,生成详细的分类报告和混淆矩阵。通过混淆矩阵分析模型的错误类型,识别是否存在特定类别的混淆问题。同时分析训练过程中损失和准确率的变化趋势,评估模型的学习效率和收敛稳定性,确保模型达到了预期的性能要求。

第五步:可解释性分析与可视化

为了增强模型的透明度和可信度,进行多方面的可解释性分析。首先可视化学习到的小波核形状,观察这些核函数是否具有合理的时频特性。然后选择代表性的振动信号样本,展示小波核卷积层提取的特征图,分析特征提取的过程和效果。接着可视化胶囊层的输出概率,观察不同故障类别对应的胶囊激活情况。最后进行可解释性对比分析,展示不同故障类别的振动信号经过模型处理后得到的特征差异,验证模型学到的特征与故障物理机理之间的关联性,提高诊断结果的可解释性和可信度。

模型性能优异:

训练效率高:仅训练5个epoch就达到99.30%的测试准确率,10个epoch达到100%准确率

收敛速度快:训练损失从1.04迅速下降到0.03,说明模型学习能力强

泛化能力好:在测试集上达到100%准确率,没有过拟合现象

类别平衡性好:三个类别(正常、滚珠故障、内圈故障)都达到100%的识别率

数据分布分析:

样本数量:共706个样本,其中正常471个,滚珠故障118个,内圈故障117个

数据划分:训练集564个(80%),测试集142个(20%)

类别不平衡:正常样本远多于故障样本,但模型仍能很好地区分

模型特点:

参数规模适中:33,747个参数,既不是过大导致过拟合,也不是过小导致欠拟合

特征提取能力强:从振动信号中提取了有效的特征

胶囊网络优势:胶囊层能够更好地建模特征之间的空间关系

训练过程分析:

快速收敛:第1个epoch损失就显著下降

稳定学习:后续epoch持续优化,损失稳步下降

优异表现:最终达到完美的分类效果

参考文章:

基于小波核卷积与动态路由胶囊网络的旋转机械故障诊断方法(Pytorch) - 哥廷根数学学派的文章
https://zhuanlan.zhihu.com/p/1983488609760846023

工学博士,担任《Mechanical System and Signal Processing》审稿专家,担任
《中国电机工程学报》优秀审稿专家,《控制与决策》,《系统工程与电子技术》,《电力系统保护与控制》,《宇航学报》等EI期刊审稿专家。
擅长领域:现代信号处理,机器学习,深度学习,数字孪生,时间序列分析,设备缺陷检测、设备异常检测、设备智能故障诊断与健康管理PHM等。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/15 4:26:11

金融数据接口实战:从入门到精通

金融数据接口实战:从入门到精通 【免费下载链接】akshare 项目地址: https://gitcode.com/gh_mirrors/aks/akshare 核心价值:AKShare能帮你解决哪些问题? Python金融数据获取的效率直接决定了量化投资研究的生产力。AKShare作为国内…

作者头像 李华
网站建设 2026/4/13 16:09:27

麦橘超然与Stable Diffusion对比:轻量设备下的推理速度实测

麦橘超然与Stable Diffusion对比:轻量设备下的推理速度实测 在显存有限的消费级显卡上跑大模型,常常像在窄巷里开卡车——不是不行,但得反复倒车、小心翼翼。最近不少朋友问:同样生成一张图,麦橘超然(Maji…

作者头像 李华
网站建设 2026/4/12 15:40:25

WuliArt Qwen-Image Turbo代码实例:RESTful API封装+JWT鉴权+限流保护

WuliArt Qwen-Image Turbo代码实例:RESTful API封装JWT鉴权限流保护 1. 为什么需要一个安全、可控的文生图服务接口 你刚在本地跑通了WuliArt Qwen-Image Turbo,输入一句“Cyberpunk street, neon lights, rain...”,几秒后一张10241024的赛博…

作者头像 李华
网站建设 2026/4/10 22:02:56

实战LeetCode刷题:VibeThinker-1.5B帮你自动生成代码

实战LeetCode刷题:VibeThinker-1.5B帮你自动生成代码 你有没有过这样的经历:打开LeetCode,盯着一道中等难度的动态规划题看了二十分钟,草稿纸上画满了状态转移图,却迟迟敲不出第一行dp [...]?或者刚写完一…

作者头像 李华
网站建设 2026/4/14 2:04:15

法律咨询录音分析,Fun-ASR辅助案件信息提取

法律咨询录音分析,Fun-ASR辅助案件信息提取 在律师事务所、法律援助中心和企业法务部门的日常工作中,一场30分钟的当事人面谈、一次1小时的调解录音、一段2小时的庭审旁听记录,往往蕴含着关键事实、争议焦点与证据线索。但人工逐字整理耗时极…

作者头像 李华
网站建设 2026/4/12 2:38:39

浅谈 MySQL InnoDB 的内存组件

前言MySQL中执行一条SQL语句,相应表数据的读写都是由存储引擎去做(更新数据、查询数据)。在这个过程,存储引擎需要决策一些事情数据是从内存查还是从硬盘查数据是更新在内存,还是硬盘内存的数据什么时候同步到硬盘所以…

作者头像 李华