1×1卷积核：深度学习的轻量化神器

2501_94023812

441人浏览 · 2026-05-20 20:34:14

2501_94023812 · 2026-05-20 20:34:14 发布

1×1卷积核是一种特殊的卷积操作，其核大小为1×1，即在空间维度上不进行任何聚合操作，仅对输入通道进行线性组合。其核心作用在于调整通道数或引入非线性。

既然知道了1×1卷积核是什么，那么你知道他的工作原理吗？

1×1卷积核工作原理

下面是他的原理图：

让我们分析一下，他其实是将输入图像的三层通道数据加权求和，融合并映射为一个新的输出特征。

以实际例子看一遍

假如1×1 卷积核，对应 3 个通道的权重设为：

w=[w1, w2, w3]=[1, 0.1, 0.01]

最终特征图：

那么，我们为什么要用他呢？

1×1 卷积完整作用总结

一、核心本质

1×1 卷积没有空间感受野，不利用相邻像素，只在通道维度做线性加权求和，运算公式和单层全连接神经网络完全一致，参数量、计算量极低。

二、详细核心作用

1. 通道维度升降维（最主要作用）

升维：少量通道→大量通道，扩充特征表达能力，丰富特征信息
降维：多通道→少通道，大幅减少通道数量，压缩特征、降低整体计算量
不改变特征图高度、宽度，只改通道数，空间尺寸全程不变

2. 跨通道特征融合

多组不同来源、不同语义的特征图堆叠拼接后，用 1×1 卷积把所有通道信息加权融合，统一特征表达，让不同通道信息相互关联整合。

3. 极致减少参数量与计算量

对比 2×2、3×3 传统卷积：3 输入通道下，1×1 仅3 个权重参数，2×2 需要12 个权重参数
相同任务下替换大卷积，算力直接大幅下降，加快模型推理、训练速度
轻量化网络必备，适合移动端、嵌入式部署

4. 替代全连接层，保留空间结构

普通全连接会把特征图压平，丢失空间位置信息；1×1 卷积全程维持C、H、W三维结构，既能做神经元式加权变换，又保留所有空间位置关系。

5. 实现多分支网络特征对齐

在残差结构、并行多分支网络中，不同分支输出通道数不一致，用 1×1 卷积快速统一通道数，让分支特征可以直接相加融合。

6. 增加网络非线性表达

1×1 卷积后搭配激活函数（ReLU 等），在不增加空间复杂度前提下，给网络加入非线性能力，提升模型拟合能力。

7. 统一特征尺度

不同层级输出特征通道杂乱，利用 1×1 卷积规整通道维度，让前后层网络衔接更顺畅。

三、和传统 2×2/3×3 卷积明确区分

1×1 卷积只做通道运算，专注维度变换、特征融合、轻量化，不学局部空间纹理、边缘、细节。
传统大卷积兼顾通道 + 邻域像素，提取局部空间特征、边缘、纹理、上下文信息，可下采样缩小特征图，计算量更大。

四、最简总概括

1×1 卷积就是分布在整张特征图上的轻量化微型全连接网络，舍弃空间邻域计算，专攻通道维度优化，以最低算力完成通道升降、特征融合、维度统一、网络轻量化四大核心任务，是深度学习网络里最实用的 “维度调节工具”。

应用场景

Inception模块：通过1×1卷积减少3×3和5×5卷积前的通道数，降低计算成本。
ResNet：在残差分支中使用1×1卷积匹配主分支的通道维度。
轻量级网络：如MobileNet用1×1卷积替代部分传统卷积，减少参数量。

代码示例（PyTorch）

import torch.nn as nn

# 定义1×1卷积层
conv1x1 = nn.Conv2d(in_channels=64, out_channels=128, kernel_size=1)

# 输入张量（batch_size=1, channels=64, height=32, width=32）
input_tensor = torch.randn(1, 64, 32, 32)
output = conv1x1(input_tensor)  # 输出形状: [1, 128, 32, 32]