基于LSTM的多特征输入分类模型探索（Matlab实现）-平芜编程栈

基于长短神经网络LSTM做多特征输入单输出的二分类及多分类模型。程序内注释详细，直接替换数据就可以用。程序语言为matlab。程序可出分类效果图，迭代优化图，混淆矩阵图具体效果如下所示。

在机器学习领域，长短时记忆网络（LSTM）凭借其处理序列数据的独特优势，在众多分类任务中崭露头角。今天咱们就来聊聊如何用Matlab基于LSTM搭建多特征输入单输出的二分类及多分类模型。

数据准备

假设我们的数据已经整理好了，存放在一个表格文件里，每一行是一个样本，不同列对应不同特征，最后一列是类别标签。Matlab里读取表格数据很方便，比如：

data = readtable('your_data_file.csv'); % 假设数据存为CSV文件 features = table2array(data(:,1:end - 1)); % 提取特征 labels = table2array(data(:,end)); % 提取标签

这段代码中，readtable函数用于读取表格数据，table2array函数将表格数据转换为便于后续处理的数组形式。我们把除最后一列之外的数据当作特征，最后一列当作类别标签。

二分类模型构建

数据预处理

对于二分类，标签通常需要转换为0和1的形式。假设原始标签是类别名称，我们可以这样转换：

% 假设原始标签有两个类别，分别是'A'和'B' unique_labels = unique(labels); new_labels = zeros(size(labels)); for i = 1:length(unique_labels) new_labels(strcmp(labels,unique_labels{i})) = i - 1; end

这里遍历唯一的类别标签，将其转换为0和1的形式。这样处理后的数据才能更好地用于二分类LSTM模型。

LSTM模型搭建

numFeatures = size(features,2); % 特征数量 numHiddenUnits = 100; % 隐藏单元数量 layers = [... sequenceInputLayer(numFeatures) % 序列输入层 lstmLayer(numHiddenUnits) % LSTM层 fullyConnectedLayer(1) % 全连接层 sigmoidLayer % 激活函数层，适用于二分类 classificationLayer]; % 分类层

sequenceInputLayer接受多特征输入，lstmLayer是核心的长短时记忆层，fullyConnectedLayer将LSTM层的输出连接到最终的预测节点，sigmoidLayer将输出值映射到0 - 1之间，适合二分类概率输出，最后classificationLayer完成分类任务。

模型训练与评估

options = trainingOptions('adam',... 'MaxEpochs',100,... 'InitialLearnRate',0.001,... 'ValidationData',{features,new_labels},... 'ValidationFrequency',10,... 'Verbose',false,... 'Plots','training-progress'); net = trainNetwork(features,new_labels,layers,options);

trainingOptions设置了训练的超参数，像优化器用adam，最大训练轮数100，初始学习率0.001等。trainNetwork函数开始训练模型。训练结束后，我们可以绘制分类效果图、迭代优化图和混淆矩阵图。

% 预测 predictions = classify(net,features); % 绘制分类效果图 figure; gscatter(features(:,1),features(:,2),predictions); title('二分类效果图'); xlabel('特征1'); ylabel('特征2'); % 绘制迭代优化图 figure; plot(options.TrainingHistory.Loss); title('迭代优化图'); xlabel('Epoch'); ylabel('Loss'); % 绘制混淆矩阵图 confusionmat(new_labels,predictions); figure; cm = confusionmat(new_labels,predictions); confusionchart(cm); title('混淆矩阵图');

classify函数用于预测类别。分类效果图通过gscatter函数绘制，展示不同类别在特征空间的分布；迭代优化图展示训练过程中损失函数的变化；混淆矩阵图用confusionmat和confusionchart绘制，直观反映分类的准确情况。

多分类模型构建

多分类和二分类在一些地方有区别。比如激活函数层和数据预处理。

数据预处理

多分类的标签处理稍有不同，假设原始标签是1，2，3...这样的类别编号，我们不需要像二分类那样特殊转换，但可能需要进行独热编码。

numClasses = numel(unique(labels)); oneHotLabels = dummyvar(labels);

dummyvar函数将类别标签转换为独热编码形式，这在多分类中很常用。

LSTM模型搭建

numFeatures = size(features,2); % 特征数量 numHiddenUnits = 100; % 隐藏单元数量 layers = [... sequenceInputLayer(numFeatures) % 序列输入层 lstmLayer(numHiddenUnits) % LSTM层 fullyConnectedLayer(numClasses) % 全连接层，输出节点数为类别数 softmaxLayer % 激活函数层，适用于多分类 classificationLayer]; % 分类层

这里的区别在于全连接层的输出节点数是类别数，激活函数层使用softmaxLayer，它能将输出转换为各类别的概率分布。

模型训练与评估

训练过程和二分类类似，只是数据用了独热编码后的标签。

options = trainingOptions('adam',... 'MaxEpochs',100,... 'InitialLearnRate',0.001,... 'ValidationData',{features,oneHotLabels},... 'ValidationFrequency',10,... 'Verbose',false,... 'Plots','training-progress'); net = trainNetwork(features,oneHotLabels,layers,options);

评估过程和二分类类似，只是预测和绘制混淆矩阵稍有不同。

% 预测 predictions = classify(net,features); % 绘制混淆矩阵图 confusionmat(labels,predictions); figure; cm = confusionmat(labels,predictions); confusionchart(cm); title('多分类混淆矩阵图');

通过上述步骤，我们就实现了基于LSTM的多特征输入单输出的二分类及多分类模型，并且能通过Matlab代码直接替换数据就使用，同时还能输出直观的效果图来评估模型性能。希望对大家在相关领域的研究和实践有所帮助。