Tensorflow:重新训练开始v3显示0%的GPU使用率

时间:2017-03-28 13:14:17

标签: tensorflow gpu

我目前正在尝试使用Tensorflow的初始模型,虽然它确实使用GPU来产生瓶颈,但它似乎并没有在训练方面做任何事情。

  • 通过nvidia-smi监控GPU使用率,它保持在0%
  • log_device_placement返回gpu:0大约80%的操作,所以看起来很好。
  • 一开始,它确实使用通常的/job:localhost/replica:0/task:0/gpu:0 -> device: 0, name: TITAN X (Pascal), pci bus id: 0000:01:00.0
  • 检测我的Titan X.
  • 分配GPU上的内存
  • 已安装CUDA,因此cuDNN都是最后一个版本
  • 温度确实上升(大约20摄氏度40-> 60),但可能是CPU加热整个箱子?

1 个答案:

答案 0 :(得分:0)

检查GPU是否与nvprof一起使用的另一种方法。它可以肯定地说出来。

对于许多模型,请检查参数以指定GPU计数。例如:num_gpus。除非指定,否则一些示例默认不使用GPU。

相关问题