基于LSTM的多特征输入分类模型探索（Matlab实现）

YJOGaHABk

11人浏览 · 2026-03-19 19:45:00

YJOGaHABk · 2026-03-19 19:45:00 发布

基于长短神经网络LSTM做多特征输入单输出的二分类及多分类模型。程序内注释详细，直接替换数据就可以用。程序语言为matlab。程序可出分类效果图，迭代优化图，混淆矩阵图具体效果如下所示。

在机器学习领域，长短时记忆网络（LSTM）凭借其处理序列数据的独特优势，在众多分类任务中崭露头角。今天咱们就来聊聊如何用Matlab基于LSTM搭建多特征输入单输出的二分类及多分类模型。

数据准备

假设我们的数据已经整理好了，存放在一个表格文件里，每一行是一个样本，不同列对应不同特征，最后一列是类别标签。Matlab里读取表格数据很方便，比如：

data = readtable('your_data_file.csv'); % 假设数据存为CSV文件
features = table2array(data(:,1:end - 1)); % 提取特征
labels = table2array(data(:,end)); % 提取标签

这段代码中，readtable函数用于读取表格数据，table2array函数将表格数据转换为便于后续处理的数组形式。我们把除最后一列之外的数据当作特征，最后一列当作类别标签。

二分类模型构建

数据预处理

对于二分类，标签通常需要转换为0和1的形式。假设原始标签是类别名称，我们可以这样转换：

% 假设原始标签有两个类别，分别是'A'和'B'
unique_labels = unique(labels);
new_labels = zeros(size(labels));
for i = 1:length(unique_labels)
    new_labels(strcmp(labels,unique_labels{i})) = i - 1;
end

这里遍历唯一的类别标签，将其转换为0和1的形式。这样处理后的数据才能更好地用于二分类LSTM模型。

LSTM模型搭建

numFeatures = size(features,2); % 特征数量
numHiddenUnits = 100; % 隐藏单元数量
layers = [...
    sequenceInputLayer(numFeatures) % 序列输入层
    lstmLayer(numHiddenUnits) % LSTM层
    fullyConnectedLayer(1) % 全连接层
    sigmoidLayer % 激活函数层，适用于二分类
    classificationLayer]; % 分类层

sequenceInputLayer接受多特征输入，lstmLayer是核心的长短时记忆层，fullyConnectedLayer将LSTM层的输出连接到最终的预测节点，sigmoidLayer将输出值映射到0 - 1之间，适合二分类概率输出，最后classificationLayer完成分类任务。

模型训练与评估

options = trainingOptions('adam',...
    'MaxEpochs',100,...
    'InitialLearnRate',0.001,...
    'ValidationData',{features,new_labels},...
    'ValidationFrequency',10,...
    'Verbose',false,...
    'Plots','training-progress');
net = trainNetwork(features,new_labels,layers,options);

trainingOptions设置了训练的超参数，像优化器用adam，最大训练轮数100，初始学习率0.001等。trainNetwork函数开始训练模型。训练结束后，我们可以绘制分类效果图、迭代优化图和混淆矩阵图。

% 预测
predictions = classify(net,features);
% 绘制分类效果图
figure;
gscatter(features(:,1),features(:,2),predictions);
title('二分类效果图');
xlabel('特征1');
ylabel('特征2');
% 绘制迭代优化图
figure;
plot(options.TrainingHistory.Loss);
title('迭代优化图');
xlabel('Epoch');
ylabel('Loss');
% 绘制混淆矩阵图
confusionmat(new_labels,predictions);
figure;
cm = confusionmat(new_labels,predictions);
confusionchart(cm);
title('混淆矩阵图');

classify函数用于预测类别。分类效果图通过gscatter函数绘制，展示不同类别在特征空间的分布；迭代优化图展示训练过程中损失函数的变化；混淆矩阵图用confusionmat和confusionchart绘制，直观反映分类的准确情况。

多分类模型构建

多分类和二分类在一些地方有区别。比如激活函数层和数据预处理。

数据预处理

多分类的标签处理稍有不同，假设原始标签是1，2，3...这样的类别编号，我们不需要像二分类那样特殊转换，但可能需要进行独热编码。

numClasses = numel(unique(labels));
oneHotLabels = dummyvar(labels);

dummyvar函数将类别标签转换为独热编码形式，这在多分类中很常用。

LSTM模型搭建

numFeatures = size(features,2); % 特征数量
numHiddenUnits = 100; % 隐藏单元数量
layers = [...
    sequenceInputLayer(numFeatures) % 序列输入层
    lstmLayer(numHiddenUnits) % LSTM层
    fullyConnectedLayer(numClasses) % 全连接层，输出节点数为类别数
    softmaxLayer % 激活函数层，适用于多分类
    classificationLayer]; % 分类层

这里的区别在于全连接层的输出节点数是类别数，激活函数层使用softmaxLayer，它能将输出转换为各类别的概率分布。

模型训练与评估

训练过程和二分类类似，只是数据用了独热编码后的标签。

options = trainingOptions('adam',...
    'MaxEpochs',100,...
    'InitialLearnRate',0.001,...
    'ValidationData',{features,oneHotLabels},...
    'ValidationFrequency',10,...
    'Verbose',false,...
    'Plots','training-progress');
net = trainNetwork(features,oneHotLabels,layers,options);

评估过程和二分类类似，只是预测和绘制混淆矩阵稍有不同。

% 预测
predictions = classify(net,features);
% 绘制混淆矩阵图
confusionmat(labels,predictions);
figure;
cm = confusionmat(labels,predictions);
confusionchart(cm);
title('多分类混淆矩阵图');

通过上述步骤，我们就实现了基于LSTM的多特征输入单输出的二分类及多分类模型，并且能通过Matlab代码直接替换数据就使用，同时还能输出直观的效果图来评估模型性能。希望对大家在相关领域的研究和实践有所帮助。

AtomGit开源社区

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念，把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起，为开发者提供从开发、训练到部署的一站式体验。

更多推荐

GPT系列发展历程：从起源到GPT-5.4的深度研究

自2018年OpenAI发布首个GPT模型以来，生成式预训练变换器（Generative Pre-trained Transformer, GPT）系列模型在自然语言处理（NLP）领域引发了革命性突破。GPT模型通过大规模无监督预训练与有监督微调相结合，展现了从文本生成到复杂推理的惊人能力。本报告系统梳理了GPT系列从起源到最新发布的GPT-5.4版本的演进脉络，深入分析各代模型的核心技术创新、能