加载VGG16时资源耗尽OOM

时间:2017-10-24 20:56:17

标签: tensorflow keras neural-network gpu

如果这个问题看起来很基本,我会事先道歉,但我是Tensorflow的新手并感谢您的帮助。

我发现我必须经常重新启动计算机才能从keras.applications加载VGG16等模型。我有一台相当高端的机器,配备4个GeForce GTX 1080 Ti GPU和Intel®Core™i7-6850K CPU @ 3.60GHz×12,用于我的CPU,仅用于Tensorflow(通过Keras)。

一旦我重新启动,我就能成功加载模型(例如VGG16)并训练大型训练数据集。但是,如果我让我的计算机闲置一段时间并重新运行相同的程序,我将获得资源耗尽消息(OOM),可以通过重新启动我的计算机来修复。每隔几个小时不停地重新启动计算机是非常令人沮丧的。有谁知道发生了什么以及如何解决这个问题?

1 个答案:

答案 0 :(得分:0)

如果批处理大小> 1,请尝试使用较小的批处理大小,这可能会降低gor GPU的内存需求。

此外,如果结束使用网络,请通过nvidia-smi检查GPU内存是否已释放。如果没有,请杀死加载网络的进程(通常是一些python解释器)。

相关问题