tensorflow获取预训练模型某层参数并赋值到当前网络指定层

曲草

6429人浏览 · 2019-04-01 14:49:36

曲草 · 2019-04-01 14:49:36 发布

已经有了一个预训练的模型，我需要从其中取出某一层，把该层的weights和biases赋值到新的网络结构中，可以使用tensorflow中的pywrap_tensorflow(用来读取预训练模型的参数值)结合Session.assign()进行操作。

这种需求即预训练模型可能为单分支网络，当前网络为多分支，我需要把单分支A复用到到多个分支去（B，C，D）。

在这里插入图片描述

先导入对应的工具包

from tensorflow.python import pywrap_tensorflow

接下来的操作在一个tf.Session中进行

reader = pywrap_tensorflow.NewCheckpointReader(pre_train_model_path)

# 获取当前图可训练变量
trainable_variables = tf.trainable_variables()
# 需要赋值的当前网络层变量，这里只是随便起的名字。
restore_v_target_name = "fc_target"
# 需要的预训练模型中的某层的名字
restore_v_source_name = "fc_source"
for v in trainable_variables:
    if restore_v_target_name == v.name:
    	# 回复weights和biases
        sess.run(
            tf.assign(v, reader.get_tensor(restore_v_source_name + "/weights"))) if "weights" in v.name else sess.run(
            tf.assign(v, reader.get_tensor(restore_v_source_name + "/biases")))