Tensorflow:optimizer.minimize() - " ValueError:Shape必须为0级但排名为1

时间:2017-08-17 11:13:34

标签: python tensorflow

我正在尝试将Tensorflow r0.12代码(从https://github.com/ZZUTK/Face-Aging-CAAE)调整为版本1.2.1,并且我遇到了optimizer.minimize()的问题。

在这种情况下,我使用的是GradientDescent,但是当我尝试使用不同的优化器时,以下错误消息仅略有不同(就提供的形状而言):

ValueError: Shape must be rank 0 but is rank 1 for 'GradientDescent/update_E_con
v0/w/ApplyGradientDescent' (op: 'ApplyGradientDescent') 
with input shapes: [5,5,1,64], [1], [5,5,1,64].

其中[5,5]是我的内核大小,1是初始通道的数量,64是第一个卷积中的过滤器数量。这是它所指的卷积编码器网络:

E_conv0:    (100, 128, 128, 64)
E_conv1:    (100, 64, 64, 128)
E_conv2:    (100, 32, 32, 256)
E_conv3:    (100, 16, 16, 512)
E_conv4:    (100, 8, 8, 1024)
E_conv5:    (100, 4, 4, 2048)
...

这是触发错误的代码:

self.EG_optimizer = tf.train.GradientDescentOptimizer(
    learning_rate=EG_learning_rate, 
    beta1=beta1
).minimize(
    loss=self.loss_EG,
    global_step=self.EG_global_step,
    var_list=self.E_variables + self.G_variables
)

其中:

EG_learning_rate = tf.train.exponential_decay(
    learning_rate=learning_rate,
    global_step=self.EG_global_step,
    decay_steps=size_data / self.size_batch * 2,
    decay_rate=decay_rate,
    staircase=True
)

self.EG_global_step = tf.get_variable(name='global_step',shape=1, initializer=tf.constant_initializer(0), trainable=False)

self.E_variables = [var for var in trainable_variables if 'E_' in var.name]
self.G_variables = [var for var in trainable_variables if 'G_' in var.name]

self.loss_EG = tf.reduce_mean(tf.abs(self.input_image - self.G))

经过一些调试后,我现在认为问题来自minimize()方法。该错误似乎归因于最后一个参数(var_list),但是当我尝试注释掉第二个或第三个参数时,错误保持不变并且仅归因于第一个参数(丢失)。

我已经更改了当前GitHub上的代码以使其适应新版本,所以我在tf.variable_scope(tf.get_variable_scope(),reuse = True)上做了很多工作。这可能是原因吗?

提前非常感谢你!

1 个答案:

答案 0 :(得分:0)

解码很棘手,因为它来自内部操作,但是这个错误信息指向了原因:

  

ValueError:Shape必须为0级,但对于'GradientDescent / update_E_conv0 / w / ApplyGradientDescent'是等级1(op:'ApplyGradientDescent')   输入形状:[5,5,1,64],1,[5,5,1,64]。

getIntent() op的输入之一是秩1张量(即向量),它应该是秩0张量(即标量)。查看definition of the ApplyGradientDescent op,唯一的标量输入是ApplyGradientDescent或学习率。

因此,alpha张量似乎是一个向量,它应该是一个标量。一个简单的解决方法是在构造EG_learning_rate时从EG_learning_rate张量“切片”一个标量:

tf.train.GradientDescentOptimizer