ResNet网络结构详解（Tensorflow2.6.0实现网络结构）

tensorflow

一个面向所有人的开源机器学习框架

项目地址：https://gitcode.com/gh_mirrors/te/tensorflow

免费下载资源

Keep_Trying_Go

6935人浏览 · 2022-04-16 20:09:46

Keep_Trying_Go · 2022-04-16 20:09:46 发布

文章目录

1.ResNetX网络结构表

（1）论文地址：

https://arxiv.org/pdf/1512.03385.pdf
在这里插入图片描述
以下图片中的网络结构方式使用pytorch实现最好，因为在tensorflow中的padding='same’或者padding=‘valid’，不能自定义。但是在本篇文章中将使用tensorflow实现ResNet网络结构。
可以看这篇博文：https://mydreamambitious.blog.csdn.net/article/details/124077928
类似使用pytorch实现自定义padding的网络结构（AlexNet）

（2）ResNet18网络结构：

在这里插入图片描述
图片来自：https://blog.csdn.net/qq_37080185/article/details/120484553

（3）ResNet34网络结构：

在这里插入图片描述

2.卷积神经网络的发展

(1).卷积神经网络的发展：

LeNet5诞生于1994年，是最早的卷积神经网络之一，并且推动了深度学习领域的发展。自从1988年开始，在多年的研究和许多次成功的迭代后，这项由Yann LeCun完成的开拓性成果被命名为LeNet5。LeNet5当时主要用户手写体数字的识别。

（2）.卷积神经网络的再一次崛起：

在2012的ImageNet图片分类任务上，AlexNet获得了冠军，自从那以后人们开始使用卷积神经网提取特征，2013的时候ZFNet获得了冠军；2014年的时候GoogleNet获得了冠军，VGG获得了亚军；都是使用了卷积神经网络提取图像的特征。

3.ResNet18网络结构讲解

（1）输入图片：

224x224x3

（2）第一层输入图片的卷积和池化：

在这里插入图片描述

卷积操作：
卷积采用步长为2，卷积核大小为7x7的卷积操作：
ouput_size=(input_size+2xpadding-kernel_size)/stride+1=(224+2x3-7)/2+1=112
输出大小：112x112x64
池化操作：
池化单元采用3x3大小，步长为2：
output_size=(input_size+2x1-3)/2+1=56
输出大小为:56x56x64

（3）第一组conv2_x:

在这里插入图片描述

两个相同的卷积操作：
卷积采用步长为1，卷积核大小为3x3的卷积操作：
ouput_size=(input_size+2xpadding-kernel_size)/stride+1=(56+2x1-3)/1+1=56
输出大小：56x56x64

（4）第一组conv3_x:

在这里插入图片描述

第一步的卷积操作：
卷积采用步长为2，卷积核大小为3x3的卷积操作：
ouput_size=(input_size+2xpadding-kernel_size)/stride+1=(56+2x1-3)/2+1=28
输出大小：28x28x128
第二步的卷积操作：
卷积采用步长为1，卷积核大小为3x3的卷积操作：
ouput_size=(input_size+2xpadding-kernel_size)/stride+1=(28+2x1-3)/1+1=28
输出大小：28x28x128
第三步identity：
第二步卷积之后通道数已经升维到了128；因为这里需要进行恒等映射，所以这里需要将原来的输入x进行1x1的卷积，步长为2进行升维，将通维度升到和第二步卷积输出相同。

（5）第一组conv4_x:

在这里插入图片描述
第一步的卷积操作：
卷积采用步长为2，卷积核大小为3x3的卷积操作：
ouput_size=(input_size+2xpadding-kernel_size)/stride+1=(28+2x1-3)/2+1=14
输出大小：14x14x256
第二步的卷积操作：
卷积采用步长为1，卷积核大小为3x3的卷积操作：
ouput_size=(input_size+2xpadding-kernel_size)/stride+1=(14+2x1-3)/1+1=14
输出大小：14x14x256
第三步identity：
第二步卷积之后通道数已经升维到了256；因为这里需要进行恒等映射，所以这里需要将原来的输入x进行1x1的卷积，步长为2进行升维，将通维度升到和第二步卷积输出相同。

（6）第一组conv5_x:

在这里插入图片描述

第一步的卷积操作：
卷积采用步长为2，卷积核大小为3x3的卷积操作：
ouput_size=(input_size+2xpadding-kernel_size)/stride+1=(14+2x1-3)/2+1=7
输出大小：7x7x512
第二步的卷积操作：
卷积采用步长为1，卷积核大小为3x3的卷积操作：
ouput_size=(input_size+2xpadding-kernel_size)/stride+1=(7+2x1-3)/1+1=7
输出大小：7x7x512
第三步identity：
第二步卷积之后通道数已经升维到了512；因为这里需要进行恒等映射，所以这里需要将原来的输入x进行1x1的卷积，步长为2进行升维，将通维度升到和第二步卷积输出相同。

（7）最后进行全局平局池化操作，全连接层和softmax，输出1000个类别概率：

在这里插入图片描述

4.相关问题和思考

（1）2.既然更深的网络可以提取到更多的特征，为什么人们不直接堆叠卷积层，使得网络的深度更深，从而提取到更多的特征呢？

讨论：这里就涉及到一个很重要的问题，就是当网络的深度加深时，会出现退化的现象。
在这里插入图片描述

从图中可以看出，56层的反而出现训练误差和测试误差都比20层的训练误差和测试误差都要大。网络变深之后还不如浅层的神经网络。
注意：这里不是出现了过拟合的现象，过拟合是在训练集上的准确率高，而在验证集上的准确率低。所以ResNet就是解决了网络退化现象。

（2）ResNet解决网络退化的机理

（1）恒定映射这一路的梯度为1，把深层梯度注入底层，防止梯度消失；
（2）skip connection 可以实现不同分辨率特征的组合；
（3）网络加深，相邻像素回传回来的梯度相关性越来越低，最后接近白噪声；但相邻像素之间具有局部相关性，相邻像素的梯度也应该局部相关。相邻像素不相关的白噪声梯度，只意味着随机扰动，并无拟合。ResNet梯度相关性衰减从增加为。保持了梯度相关性。
（4）残差网络相当于不同长度的神经网络组成的组合函数；
（5）残差模块相当于一个差分放大器。

参考：
a.ResNet深度残差网络
https://b23.tv/k0skBHU
b.Resnet到底在解决一个什么问题呢https://www.zhihu.com/question/64494691
c.为什么resnet效果会那么好
https://www.zhihu.com/question/52375139

（3）解决shortcut connection时恒等映射问题

在这里插入图片描述

使用三种方式解决这个问题，上面的A,B,C分别代表三种方式的实验结果：
A——所有的shortcut无额外的参数，升维时采用padding补零的方式；
B——普通的shortcut使用identify mapping（恒等映射）升维时使用1x1卷积升维；
C——所有的shortcut都使用1x1卷积升维；
（a）A,B,C三种方式都比不带残差模块的模型都要好；其中A在升维的时候直接使用补零的方式，所以相当于丢失了shortcut分支的信息，没有进行残差学习；
（b）C的13个非下采样模块的shortcut都有参数，模型的表达能力更强；
（c）可以看到上面的三种方式中，C方式虽然是最好的，但是却引入的额外的参数量，所以这种方式并不是最适合的。说明identify mapping（恒等映射）已经足够解决shortcut问题。

（4）为什么ResNet结构可以有效解决因网络层数增加而导致模型难以训练的问题？

在这里插入图片描述
参考博文：
https://blog.csdn.net/weixin_44815085/article/details/104348749

（5）拓展

（1）更深层的网络提取的特征也更加的丰富，也越来越特化和更加的难理解；
（2）直接堆叠网络的深度会造成梯度消失和爆炸的问题。

5.ResNet18,34,50结构实现（Tensorflow2.6.0）

（1）ResNet18,34结构：

在这里插入图片描述

import keras
import  numpy as np
import  tensorflow as tf
from tensorflow.keras import layers
import tensorflow.keras.applications.resnet
from tensorflow.keras.applications.vgg16 import preprocess_input,decode_predictions

# resnet50=tensorflow.keras.applications.resnet.ResNet50(weights='imagenet')
class ResNetBasicBlock(tf.keras.Model):
    def __init__(self,filter_size,stride=1):
        #对父类进行初始化
        super(ResNetBasicBlock,self).__init__()
        self.conv1=layers.Conv2D(filter_size,kernel_size=[3,3],strides=stride,padding='same')
        self.BN1=layers.BatchNormalization()
        self.relu1=layers.Activation('relu')

        self.conv2=layers.Conv2D(filter_size,kernel_size=[3,3],strides=[1,1],padding='same')
        self.BN2=layers.BatchNormalization()

        if stride!=1:
            self.SubSampling=keras.Sequential([
                layers.Conv2D(filter_size,kernel_size=[1,1],strides=stride)
            ])
        else:
            self.SubSampling=lambda x:x
    def call(self,inputs,training=None):
        x=self.conv1(inputs)
        x=self.BN1(x)
        x=self.relu1(x)

        x=self.conv2(x)
        x=self.BN2(x)

        identify=self.SubSampling(inputs)
        out_x=layers.add([identify,x])
        out_x=tf.nn.relu(out_x)
        return out_x


class ResNet(tf.keras.Model):
    def __init__(self,layer_nums,num_classes=1000):
        super(ResNet,self).__init__()
        self.Input=keras.Sequential([
            layers.Conv2D(64, kernel_size=[7,7], strides=[2,2],padding='same'),
            layers.BatchNormalization(),
            layers.Activation('relu'),
            layers.MaxPool2D(pool_size=[3,3],strides=[2,2],padding='same')
        ])
        self.layer1=self.build_BasicBlock(64,layer_nums[0],stride=1)
        self.layer2=self.build_BasicBlock(128,layer_nums[1],stride=2)
        self.layer3=self.build_BasicBlock(256,layer_nums[2],stride=2)
        self.layer4=self.build_BasicBlock(512,layer_nums[3],stride=2)

        self.Globavgpooling=layers.GlobalAveragePooling2D()
        self.Dense=layers.Dense(num_classes)
        self.softmax=layers.Activation('softmax')

    def build_BasicBlock(self,filter_size,layer_num,stride):
        res_block=keras.Sequential([
            ResNetBasicBlock(filter_size,stride)
        ])
        for i in range(1,layer_num):
            res_block.add(
                ResNetBasicBlock(filter_size,stride=1)
            )
        return res_block

    def call(self,inputs,training=None):
        x=self.Input(inputs)

        x=self.layer1(x)
        x=self.layer2(x)
        x=self.layer3(x)
        x=self.layer4(x)

        x=self.Globavgpooling(x)
        x=self.Dense(x)
        out_x=self.softmax(x)
        return out_x

model_renset18=ResNet([2,2,2,2])
model_renset18.build(input_shape=(None,224,224,3))
model_renset18.summary()
model_renset34=ResNet([3,4,6,3])
model_renset34.build(input_shape=(None,224,224,3))
model_renset34.summary()

在这里插入图片描述

（2）ResNet50结构：

在这里插入图片描述

import keras
import  numpy as np
import  tensorflow as tf
from tensorflow.keras import layers
import tensorflow.keras.applications.resnet
from tensorflow.keras.applications.vgg16 import preprocess_input,decode_predictions

# resnet50=tensorflow.keras.applications.resnet.ResNet50(weights='imagenet')
class ResNetBasicBlock(tf.keras.Model):
    def __init__(self,filter_size,stride=1):
        #对父类进行初始化
        super(ResNetBasicBlock,self).__init__()
        self.conv1=layers.Conv2D(filter_size,kernel_size=[1,1],strides=stride,padding='same')
        self.BN1=layers.BatchNormalization()
        self.relu1=layers.Activation('relu')

        self.conv2=layers.Conv2D(filter_size,kernel_size=[3,3],strides=[1,1],padding='same')
        self.BN2=layers.BatchNormalization()
        self.relu2=layers.Activation('relu')

        self.conv2 = layers.Conv2D(filter_size*4, kernel_size=[1,1], strides=[1, 1], padding='same')
        self.BN2 = layers.BatchNormalization()

        if stride!=1:
            self.SubSampling=keras.Sequential([
                layers.Conv2D(filter_size*4,kernel_size=[1,1],strides=stride)
            ])
        else:
            self.SubSampling=keras.Sequential([
                layers.Conv2D(filter_size*4,kernel_size=[1,1],strides=[1,1])
            ])
    def call(self,inputs,training=None):
        x=self.conv1(inputs)
        x=self.BN1(x)
        x=self.relu1(x)

        x=self.conv2(x)
        x=self.BN2(x)
        x=self.relu2(x)

        identify=self.SubSampling(inputs)
        out_x=layers.add([identify,x])
        out_x=tf.nn.relu(out_x)
        return out_x


class ResNet(tf.keras.Model):
    def __init__(self,layer_nums,num_classes=1000):
        super(ResNet,self).__init__()
        self.Input=keras.Sequential([
            layers.Conv2D(64, kernel_size=[7,7], strides=[2,2],padding='same'),
            layers.BatchNormalization(),
            layers.Activation('relu'),
            layers.MaxPool2D(pool_size=[3,3],strides=[2,2],padding='same')
        ])
        self.layer1=self.build_BasicBlock(64,layer_nums[0],stride=1)
        self.layer2=self.build_BasicBlock(128,layer_nums[1],stride=2)
        self.layer3=self.build_BasicBlock(256,layer_nums[2],stride=2)
        self.layer4=self.build_BasicBlock(512,layer_nums[3],stride=2)

        self.Globavgpooling=layers.GlobalAveragePooling2D()
        self.Dense=layers.Dense(num_classes)
        self.softmax=layers.Activation('softmax')

    def build_BasicBlock(self,filter_size,layer_num,stride):
        res_block=keras.Sequential([
            ResNetBasicBlock(filter_size,stride)
        ])
        for i in range(1,layer_num):
            res_block.add(
                ResNetBasicBlock(filter_size,stride=1)
            )
        return res_block

    def call(self,inputs,training=None):
        x=self.Input(inputs)

        x=self.layer1(x)
        x=self.layer2(x)
        x=self.layer3(x)
        x=self.layer4(x)

        x=self.Globavgpooling(x)
        x=self.Dense(x)
        out_x=self.softmax(x)
        return out_x

model_renset50=ResNet([3,4,6,3])
model_renset50.build(input_shape=(None,224,224,3))
model_renset50.summary()

在这里插入图片描述

6.测试设计的网络结构（进行图片数据集的训练）

关于数据集和训练的代码参考这篇文章：
https://mydreamambitious.blog.csdn.net/article/details/123966676
只需要将代码中的网络结构换成上面的这个InceptionV1结构即可训练。但是有一点要注意就是我给出的这个网络结构最后输出类别为1000，而训练数据集的代码只有两个类别。

GitHub 加速计划 / te / tensorflow

184.54 K

74.12 K

下载

一个面向所有人的开源机器学习框架

最近提交(Master分支：23 天前 )

a49e66f2 PiperOrigin-RevId: 663726708 1 个月前

91dac11a This test overrides disabled_backends, dropping the default value in the process. PiperOrigin-RevId: 663711155 1 个月前

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

[转载]在Windows环境下安装GNU Radio

转自：在Windows环境下安装GNURadio_恐弱智_新浪博客GNU Radio是用Python开发的，大部分开源的工程能够在Linux环境下运行良好，而Windows下却运行的很勉强，而且安装配置都很复杂。GNU Radio算是个例外了，不光提供了Windows的二进制安装，还有比较详细的说明。我是Python小白，所以折腾了好久才弄好，特意记录下来，免得以后再装还折腾。GNU Radio的

GitCode 开源社区

centOS 8 使用dnf安装Docker

DNF是什么？CentOS 8使用YUM软件包管理器版本v4.0.4。现在，该版本使用DNF(已删除YUM)。DNF是软件包管理器。它会在Linux发行版上安装，执行更新并删除软件包。使用DNF安装Docker跳过具有损坏依赖性的程序包一个有效的解决方案是使您的CentOS 8系统使用以下--nobest命令安装最符合条件的版本：sudo dnf install docker...

GitCode 开源社区

定时同步数据库表(mysql+linux+crontab)

sync.sh里面的参数需要改变，ip/username/password/database/tablesync.sh#!/bin/sh# Please change the IP and password of the data source db.# Then change the table name.filename=/home/nington/db/$(date +%Y-%m