tensorflow - 在大批量上运行优化器操作

时间:2017-03-02 12:15:16

标签: python memory tensorflow

通常,我们使用优化器操作调用run命令作为输入来更新某些模型的可训练参数:

session.run(model.optimizer_op, feed_dict={model.X: X_batch, model.y: y_batch})

但是当批量大时,X_batch无法适应GPU内存。 如何拆分此任务以处理大批量?

1 个答案:

答案 0 :(得分:0)

这主要取决于您的GPU内存大小。但是,很难将整个数据集与模型及其所需的操作(即预测概率)相匹配。因此,您需要考虑以不同的角度进行批处理。我假设你的代码遵循这些方针:

# Model Definition    
X = tf.placeholder(tf.float32, shape=[None, DIM,DIM,3], name='X')
y = tf.placeholder(tf.float32, shape=[None, N_CLASSES], name='y')

...

train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)

...

# Training your model
sess.run([train_step], feed_dict={X: X_batch, y: y_batch})

而不是使用Xy作为feed_dict train_step。您可以为所有批次(即整个数据集)累积cross_entropy。然后,您可以运行train_step一次。例如:

cross_entropy_all = []
for X_batch, y_batch in batches_generator():
    cross_entropy_all += sess.run([cross_entropy], feed_dict={X: X_batch, y: y_batch})

# Numpy or Tensorflow equivalent for `vstack`
cross_entropy_all = np.vstack(cross_entropy_all)

# Run the optimizer on the entire dataset (not just on a specific batch)
sess.run([train_step], feed_dict={cross_entropy: cross_entropy_all})

这应该在不运行GPU内存的情况下实现目标。建议的方法针对所有交叉熵运行优化步骤。因此,您不需要提供X和y(生成cross_entropy所使用/需要的,因为它已经被提供给优化步骤)。

相关问题