Theano和pygpu:错误

时间:2017-10-26 20:23:16

标签: python machine-learning cuda theano theano-cuda

我正在使用Theano和pygpu。

一般来说,它运作良好,直到我仍然无法理解的原因,一旦我尝试导入theano,它会显示以下错误:

ERROR (theano.gpuarray): Could not initialize pygpu, support disabled
Traceback (most recent call last):
  File "/home/poko/Software/anaconda2/lib/python2.7/site-packages/theano/gpuarray/__init__.py", line 220, in <module>
    use(config.device)
  File "/home/poko/Software/anaconda2/lib/python2.7/site-packages/theano/gpuarray/__init__.py", line 207, in use
    init_dev(device, preallocate=preallocate)
  File "/home/poko/Software/anaconda2/lib/python2.7/site-packages/theano/gpuarray/__init__.py", line 94, in init_dev
    **args)
  File "pygpu/gpuarray.pyx", line 651, in pygpu.gpuarray.init
  File "pygpu/gpuarray.pyx", line 587, in pygpu.gpuarray.pygpu_init
GpuArrayException: cuInit: CUDA_ERROR_UNKNOWN: unknown error

如果我重新启动计算机,它会再次运行一段时间(有时会持续数天......)。

现在情况很奇怪,因为这样的事情要么有效,要么不行。 除了从nvidia-smi观察xorg和chrome确实吸收了相当多的内存之外,我对产生错误的原因并不是最微不足道的。

+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0      1332      G   /usr/lib/xorg/Xorg                           392MiB |
|    0      2243      G   cinnamon                                     110MiB |
|    0      4927      G   ...-token=39C210A3DFA14C5D81FA629C813B843D   154MiB |
+-----------------------------------------------------------------------------+

1 个答案:

答案 0 :(得分:0)

事实证明,我只需卸下 nvidia_uvm 模块即可摆脱错误:

sudo rmmod nvidia_uvm

之后,它将自动重新加载。

希望如果其他人遇到这个问题,这会有所帮助。