基于长短神经网络LSTM做多特征输入单输出的二分类及多分类模型。 程序内注释详细,直接替换数据就可以用。 程序语言为matlab。 程序可出分类效果图,迭代优化图,混淆矩阵图具体效果如下所示。

在机器学习领域,长短时记忆网络(LSTM)凭借其处理序列数据的独特优势,在众多分类任务中崭露头角。今天咱们就来聊聊如何用Matlab基于LSTM搭建多特征输入单输出的二分类及多分类模型。

数据准备

假设我们的数据已经整理好了,存放在一个表格文件里,每一行是一个样本,不同列对应不同特征,最后一列是类别标签。Matlab里读取表格数据很方便,比如:

data = readtable('your_data_file.csv'); % 假设数据存为CSV文件
features = table2array(data(:,1:end - 1)); % 提取特征
labels = table2array(data(:,end)); % 提取标签

这段代码中,readtable函数用于读取表格数据,table2array函数将表格数据转换为便于后续处理的数组形式。我们把除最后一列之外的数据当作特征,最后一列当作类别标签。

二分类模型构建

数据预处理

对于二分类,标签通常需要转换为0和1的形式。假设原始标签是类别名称,我们可以这样转换:

% 假设原始标签有两个类别,分别是'A'和'B'
unique_labels = unique(labels);
new_labels = zeros(size(labels));
for i = 1:length(unique_labels)
    new_labels(strcmp(labels,unique_labels{i})) = i - 1;
end

这里遍历唯一的类别标签,将其转换为0和1的形式。这样处理后的数据才能更好地用于二分类LSTM模型。

LSTM模型搭建

numFeatures = size(features,2); % 特征数量
numHiddenUnits = 100; % 隐藏单元数量
layers = [...
    sequenceInputLayer(numFeatures) % 序列输入层
    lstmLayer(numHiddenUnits) % LSTM层
    fullyConnectedLayer(1) % 全连接层
    sigmoidLayer % 激活函数层,适用于二分类
    classificationLayer]; % 分类层

sequenceInputLayer接受多特征输入,lstmLayer是核心的长短时记忆层,fullyConnectedLayer将LSTM层的输出连接到最终的预测节点,sigmoidLayer将输出值映射到0 - 1之间,适合二分类概率输出,最后classificationLayer完成分类任务。

模型训练与评估

options = trainingOptions('adam',...
    'MaxEpochs',100,...
    'InitialLearnRate',0.001,...
    'ValidationData',{features,new_labels},...
    'ValidationFrequency',10,...
    'Verbose',false,...
    'Plots','training-progress');
net = trainNetwork(features,new_labels,layers,options);

trainingOptions设置了训练的超参数,像优化器用adam,最大训练轮数100,初始学习率0.001等。trainNetwork函数开始训练模型。训练结束后,我们可以绘制分类效果图、迭代优化图和混淆矩阵图。

% 预测
predictions = classify(net,features);
% 绘制分类效果图
figure;
gscatter(features(:,1),features(:,2),predictions);
title('二分类效果图');
xlabel('特征1');
ylabel('特征2');
% 绘制迭代优化图
figure;
plot(options.TrainingHistory.Loss);
title('迭代优化图');
xlabel('Epoch');
ylabel('Loss');
% 绘制混淆矩阵图
confusionmat(new_labels,predictions);
figure;
cm = confusionmat(new_labels,predictions);
confusionchart(cm);
title('混淆矩阵图');

classify函数用于预测类别。分类效果图通过gscatter函数绘制,展示不同类别在特征空间的分布;迭代优化图展示训练过程中损失函数的变化;混淆矩阵图用confusionmatconfusionchart绘制,直观反映分类的准确情况。

多分类模型构建

多分类和二分类在一些地方有区别。比如激活函数层和数据预处理。

数据预处理

多分类的标签处理稍有不同,假设原始标签是1,2,3...这样的类别编号,我们不需要像二分类那样特殊转换,但可能需要进行独热编码。

numClasses = numel(unique(labels));
oneHotLabels = dummyvar(labels);

dummyvar函数将类别标签转换为独热编码形式,这在多分类中很常用。

LSTM模型搭建

numFeatures = size(features,2); % 特征数量
numHiddenUnits = 100; % 隐藏单元数量
layers = [...
    sequenceInputLayer(numFeatures) % 序列输入层
    lstmLayer(numHiddenUnits) % LSTM层
    fullyConnectedLayer(numClasses) % 全连接层,输出节点数为类别数
    softmaxLayer % 激活函数层,适用于多分类
    classificationLayer]; % 分类层

这里的区别在于全连接层的输出节点数是类别数,激活函数层使用softmaxLayer,它能将输出转换为各类别的概率分布。

模型训练与评估

训练过程和二分类类似,只是数据用了独热编码后的标签。

options = trainingOptions('adam',...
    'MaxEpochs',100,...
    'InitialLearnRate',0.001,...
    'ValidationData',{features,oneHotLabels},...
    'ValidationFrequency',10,...
    'Verbose',false,...
    'Plots','training-progress');
net = trainNetwork(features,oneHotLabels,layers,options);

评估过程和二分类类似,只是预测和绘制混淆矩阵稍有不同。

% 预测
predictions = classify(net,features);
% 绘制混淆矩阵图
confusionmat(labels,predictions);
figure;
cm = confusionmat(labels,predictions);
confusionchart(cm);
title('多分类混淆矩阵图');

通过上述步骤,我们就实现了基于LSTM的多特征输入单输出的二分类及多分类模型,并且能通过Matlab代码直接替换数据就使用,同时还能输出直观的效果图来评估模型性能。希望对大家在相关领域的研究和实践有所帮助。

基于长短神经网络LSTM做多特征输入单输出的二分类及多分类模型。 程序内注释详细,直接替换数据就可以用。 程序语言为matlab。 程序可出分类效果图,迭代优化图,混淆矩阵图具体效果如下所示。

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐