CNN、LSTM、CNN_LSTM模型打包：时间序列预测的对比实验

OoxJqfQCaS

265人浏览 · 2026-03-25 08:30:00

OoxJqfQCaS · 2026-03-25 08:30:00 发布

CNN、LSTM、CNN_LSTM时间序列预测（三个模型一起打包）三个模型一起，都是替换excel直接运行即可，可做一个对比实验

窗外飘着雨，最适合折腾时间序列预测模型。今天咱们来玩点实际的——把CNN、LSTM以及它们的混合体CNN-LSTM三个模型塞进同一份数据里，直接替换Excel文件就能跑。代码直接怼在Jupyter里，Ctrl+C/V就能用，顺便看看到底哪个模型更抗打。

数据准备：别让Excel拖后腿

首先得把数据从Excel里拽出来。假设你的数据长这样：一列时间戳，一列数值（比如股票收盘价），存成data.xlsx。咱们用Pandas三行代码搞定：

import pandas as pd
data = pd.read_excel('data.xlsx', usecols=[1]) # 假设数值在第二列
values = data.values.astype('float32')

接下来得把数据抻成模型能吃的形状。时间序列预测一般是「用前N天预测下一天」，这里取窗口宽度为30天：

import numpy as np
def create_dataset(dataset, lookback=30):
    X, y = [], []
    for i in range(len(dataset)-lookback):
        X.append(dataset[i:(i+lookback), 0])
        y.append(dataset[i+lookback, 0])
    return np.array(X), np.array(y)

X, y = create_dataset(values)

归一化是必选项，不然模型训练能给你脸色看：

from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
X = scaler.fit_transform(X)
y = scaler.transform(y.reshape(-1,1)).flatten()

最后切分训练集和测试集，注意时间序列不能随机打乱：

train_size = int(len(X)*0.8)
X_train, X_test = X[:train_size], X[train_size:]
y_train, y_test = y[:train_size], y[train_size:]

CNN：一维卷积的暴力美学

CNN不是图像专利，一维卷积在时间轴上滑动照样生猛。关键要把数据reshape成（样本数，时间步长，特征数）的格式：

X_train_cnn = X_train.reshape(X_train.shape[0], X_train.shape[1], 1)
X_test_cnn = X_test.reshape(X_test.shape[0], X_test.shape[1], 1)

模型结构简单粗暴——卷积层抓局部特征，池化层压缩信息，最后全连接输出预测值：

from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv1D, MaxPooling1D, Flatten, Dense

model_cnn = Sequential()
model_cnn.add(Conv1D(64, 3, activation='relu', input_shape=(30, 1)))
model_cnn.add(MaxPooling1D(2))
model_cnn.add(Flatten())
model_cnn.add(Dense(50, activation='relu'))
model_cnn.add(Dense(1))
model_cnn.compile(optimizer='adam', loss='mae')

训练时记得用shuffle=False，时间序列最忌讳乱序：

history_cnn = model_cnn.fit(X_train_cnn, y_train, epochs=50, 
                          batch_size=32, validation_split=0.1, 
                          shuffle=False)

LSTM：记忆大师的表演

LSTM的门控机制专治各种长期依赖。数据格式和CNN类似，但不需要额外reshape：

X_train_lstm = X_train.reshape(X_train.shape[0], X_train.shape[1], 1)
X_test_lstm = X_test.reshape(X_test.shape[0], X_test.shape[1], 1)

模型里堆两个LSTM层，中间用return_sequences=True传递状态：

from tensorflow.keras.layers import LSTM

model_lstm = Sequential()
model_lstm.add(LSTM(64, return_sequences=True, input_shape=(30,1)))
model_lstm.add(LSTM(32))
model_lstm.add(Dense(1))
model_lstm.compile(optimizer='adam', loss='mae')

训练参数和CNN保持一致方便对比：

history_lstm = model_lstm.fit(X_train_lstm, y_train, epochs=50,
                             batch_size=32, validation_split=0.1,
                             shuffle=False)

CNN-LSTM：混合双打

这个组合的精髓在于用CNN提取局部特征，再交给LSTM处理时序关系。需要注意维度衔接——CNN输出要保留时间步：

model_mix = Sequential()
model_mix.add(Conv1D(64, 3, activation='relu', input_shape=(30,1)))
model_mix.add(MaxPooling1D(2)) # 输出形状变成(None,14,64)
model_mix.add(LSTM(64, return_sequences=True)) 
model_mix.add(LSTM(32))
model_mix.add(Dense(1))
model_mix.compile(optimizer='adam', loss='mae')

这里有个坑：池化后的时间步数从30变成14（因为池化窗口为2），所以LSTM的输入维度自动匹配。如果调整卷积参数导致维度对不上，模型会直接报错。

模型PK：谁是真王者？

训练完成后，用测试集一决高下：

def evaluate_model(model, X_test, y_test):
    y_pred = model.predict(X_test)
    y_pred = scaler.inverse_transform(y_pred)
    y_true = scaler.inverse_transform(y_test.reshape(-1,1))
    mae = np.mean(np.abs(y_pred - y_true))
    print(f'MAE: {mae:.2f}')

print("CNN表现:")
evaluate_model(model_cnn, X_test_cnn, y_test)
print("LSTM表现:")
evaluate_model(model_lstm, X_test_lstm, y_test) 
print("CNN-LSTM表现:")
evaluate_model(model_mix, X_test_cnn, y_test) # 注意这里用CNN处理过的数据

实测某股票数据集结果：