重新启动后缺少GPU

时间:2019-02-21 10:51:20

标签: azure gpu azure-dsvm

我在Azure中使用标准NC24rs_v3(24 vcpus,448 GB内存)大小的VM和``数据科学虚拟机''映像。第一次在4个GPU上运行良好。但是,如果我重新启动了VM,nvidia-smi只能找到1个GPU。我不得不一次又一次地重新创建一个新的VM。我认为这是关于cuda驱动程序的错误。

我使用以下命令来安装CUDA 10。

sudo apt-get -y remove --purge nvidia*
sudo apt-get -y autoremove
mkdir ~/tmp
cd ~/tmp
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/cuda-repo-ubuntu1604_10.0.130-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1604_10.0.130-1_amd64.deb
sudo apt-key adv --fetch-keys http://developer.download.nvidia.com/compute/cuda/repos/ubuntu1604/x86_64/7fa2af80.pub
sudo apt-get update
sudo apt-get -y install cuda

0 个答案:

没有答案