1×1卷积核是一种特殊的卷积操作,其核大小为1×1,即在空间维度上不进行任何聚合操作,仅对输入通道进行线性组合。其核心作用在于调整通道数或引入非线性。

既然知道了1×1卷积核是什么,那么你知道他的工作原理吗?

1×1卷积核工作原理

下面是他的原理图:

让我们分析一下,他其实是将输入图像的三层通道数据加权求和,融合并映射为一个新的输出特征。

以实际例子看一遍

假如1×1 卷积核,对应 3 个通道的权重设为:

w=[w1​, w2​, w3​]=[1, 0.1, 0.01]

最终特征图:

那么,我们为什么要用他呢?

1×1 卷积完整作用总结

一、核心本质

1×1 卷积没有空间感受野,不利用相邻像素,只在通道维度做线性加权求和,运算公式和单层全连接神经网络完全一致,参数量、计算量极低。

二、详细核心作用

1. 通道维度升降维(最主要作用)

  • 升维:少量通道→大量通道,扩充特征表达能力,丰富特征信息
  • 降维:多通道→少通道,大幅减少通道数量,压缩特征、降低整体计算量
  • 不改变特征图高度、宽度,只改通道数,空间尺寸全程不变

2. 跨通道特征融合

多组不同来源、不同语义的特征图堆叠拼接后,用 1×1 卷积把所有通道信息加权融合,统一特征表达,让不同通道信息相互关联整合。

3. 极致减少参数量与计算量

  • 对比 2×2、3×3 传统卷积:3 输入通道下,1×1 仅3 个权重参数,2×2 需要12 个权重参数
  • 相同任务下替换大卷积,算力直接大幅下降,加快模型推理、训练速度
  • 轻量化网络必备,适合移动端、嵌入式部署

4. 替代全连接层,保留空间结构

普通全连接会把特征图压平,丢失空间位置信息;1×1 卷积全程维持C、H、W三维结构,既能做神经元式加权变换,又保留所有空间位置关系

5. 实现多分支网络特征对齐

在残差结构、并行多分支网络中,不同分支输出通道数不一致,用 1×1 卷积快速统一通道数,让分支特征可以直接相加融合。

6. 增加网络非线性表达

1×1 卷积后搭配激活函数(ReLU 等),在不增加空间复杂度前提下,给网络加入非线性能力,提升模型拟合能力。

7. 统一特征尺度

不同层级输出特征通道杂乱,利用 1×1 卷积规整通道维度,让前后层网络衔接更顺畅。

三、和传统 2×2/3×3 卷积明确区分

  1. 1×1 卷积只做通道运算,专注维度变换、特征融合、轻量化,不学局部空间纹理、边缘、细节。
  2. 传统大卷积兼顾通道 + 邻域像素,提取局部空间特征、边缘、纹理、上下文信息,可下采样缩小特征图,计算量更大。

四、最简总概括

1×1 卷积就是分布在整张特征图上的轻量化微型全连接网络,舍弃空间邻域计算,专攻通道维度优化,以最低算力完成通道升降、特征融合、维度统一、网络轻量化四大核心任务,是深度学习网络里最实用的 “维度调节工具”。

应用场景

  • Inception模块:通过1×1卷积减少3×3和5×5卷积前的通道数,降低计算成本。
  • ResNet:在残差分支中使用1×1卷积匹配主分支的通道维度。
  • 轻量级网络:如MobileNet用1×1卷积替代部分传统卷积,减少参数量。

代码示例(PyTorch)

import torch.nn as nn

# 定义1×1卷积层
conv1x1 = nn.Conv2d(in_channels=64, out_channels=128, kernel_size=1)

# 输入张量(batch_size=1, channels=64, height=32, width=32)
input_tensor = torch.randn(1, 64, 32, 32)
output = conv1x1(input_tensor)  # 输出形状: [1, 128, 32, 32]
 

Logo

AtomGit 是由开放原子开源基金会联合 CSDN 等生态伙伴共同推出的新一代开源与人工智能协作平台。平台坚持“开放、中立、公益”的理念,把代码托管、模型共享、数据集托管、智能体开发体验和算力服务整合在一起,为开发者提供从开发、训练到部署的一站式体验。

更多推荐