1×1卷积核:深度学习的轻量化神器
1×1卷积核是一种特殊的卷积操作,其核大小为1×1,即在空间维度上不进行任何聚合操作,仅对输入通道进行线性组合。其核心作用在于调整通道数或引入非线性。
既然知道了1×1卷积核是什么,那么你知道他的工作原理吗?
1×1卷积核工作原理
下面是他的原理图:

让我们分析一下,他其实是将输入图像的三层通道数据加权求和,融合并映射为一个新的输出特征。
以实际例子看一遍

假如1×1 卷积核,对应 3 个通道的权重设为:
w=[w1, w2, w3]=[1, 0.1, 0.01]

最终特征图:

那么,我们为什么要用他呢?
1×1 卷积完整作用总结
一、核心本质
1×1 卷积没有空间感受野,不利用相邻像素,只在通道维度做线性加权求和,运算公式和单层全连接神经网络完全一致,参数量、计算量极低。
二、详细核心作用
1. 通道维度升降维(最主要作用)
- 升维:少量通道→大量通道,扩充特征表达能力,丰富特征信息
- 降维:多通道→少通道,大幅减少通道数量,压缩特征、降低整体计算量
- 不改变特征图高度、宽度,只改通道数,空间尺寸全程不变
2. 跨通道特征融合
多组不同来源、不同语义的特征图堆叠拼接后,用 1×1 卷积把所有通道信息加权融合,统一特征表达,让不同通道信息相互关联整合。
3. 极致减少参数量与计算量
- 对比 2×2、3×3 传统卷积:3 输入通道下,1×1 仅3 个权重参数,2×2 需要12 个权重参数
- 相同任务下替换大卷积,算力直接大幅下降,加快模型推理、训练速度
- 轻量化网络必备,适合移动端、嵌入式部署
4. 替代全连接层,保留空间结构
普通全连接会把特征图压平,丢失空间位置信息;1×1 卷积全程维持C、H、W三维结构,既能做神经元式加权变换,又保留所有空间位置关系。
5. 实现多分支网络特征对齐
在残差结构、并行多分支网络中,不同分支输出通道数不一致,用 1×1 卷积快速统一通道数,让分支特征可以直接相加融合。
6. 增加网络非线性表达
1×1 卷积后搭配激活函数(ReLU 等),在不增加空间复杂度前提下,给网络加入非线性能力,提升模型拟合能力。
7. 统一特征尺度
不同层级输出特征通道杂乱,利用 1×1 卷积规整通道维度,让前后层网络衔接更顺畅。
三、和传统 2×2/3×3 卷积明确区分
- 1×1 卷积只做通道运算,专注维度变换、特征融合、轻量化,不学局部空间纹理、边缘、细节。
- 传统大卷积兼顾通道 + 邻域像素,提取局部空间特征、边缘、纹理、上下文信息,可下采样缩小特征图,计算量更大。
四、最简总概括
1×1 卷积就是分布在整张特征图上的轻量化微型全连接网络,舍弃空间邻域计算,专攻通道维度优化,以最低算力完成通道升降、特征融合、维度统一、网络轻量化四大核心任务,是深度学习网络里最实用的 “维度调节工具”。
应用场景
- Inception模块:通过1×1卷积减少3×3和5×5卷积前的通道数,降低计算成本。
- ResNet:在残差分支中使用1×1卷积匹配主分支的通道维度。
- 轻量级网络:如MobileNet用1×1卷积替代部分传统卷积,减少参数量。
代码示例(PyTorch)
import torch.nn as nn
# 定义1×1卷积层
conv1x1 = nn.Conv2d(in_channels=64, out_channels=128, kernel_size=1)
# 输入张量(batch_size=1, channels=64, height=32, width=32)
input_tensor = torch.randn(1, 64, 32, 32)
output = conv1x1(input_tensor) # 输出形状: [1, 128, 32, 32]
AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。
更多推荐



所有评论(0)