我已经能够使用nvidia-smi 418.39,驱动程序版本418.39和CUDA 10.1成功设置Ubuntu 18.04服务器
我现在有一个用户想要运行TensorFlow,但坚持认为它与CUDA 10.1不兼容,仅与CUDA 10不兼容。在我可以找到的任何地方,都没有在线确认这一点的声明,也没有来自任何发行补丁说明的声明。 TF。因为设置此系统有点麻烦,所以我有点犹豫,只尝试降级一个版本。
有人可以验证TensorFlow 1.12是否与CUDA 10.1一起使用吗?
答案 0 :(得分:5)
我可以确认,即使tf 1.13.1对我来说也只能使用CUDA 10.0,而不是10.1。 不知道symlink是否可以正常工作。 如果您尝试在CUDA 10.1上运行tf 1.13.1,它将显示“ ImportError:libcublas.so.10.0:无法打开共享库文件:没有此类文件或目录”
答案 1 :(得分:1)
我还可以确认tf 1.13.1不适用于CUDA 10.1。导入tensorflow时会出现以下错误
ImportError:libcublas.so.10.0:无法打开共享对象文件:没有这样的文件或目录
运行ldconfig -v显示差异 libcublas.so.10.0和libcublas.so.10.1.0.105
答案 2 :(得分:0)
TensorFlow 1.12(甚至更高的版本1.13.1和2.0.0-alpha0)可能 不是针对CUDA 10.1构建的,因此可以认为是不兼容的。
我尝试从具有GPU支持的源代码构建TensorFlow。我考虑的TensorFlow版本为 1.13.1 和 2.0.0-alpha0 。我使用的机器在GCC 4.8.5上运行CentOS 7.6。我安装了NVIDIA驱动程序版本 418.67 (发行日期为2019.5.7,并支持CUDA Toolkit 10.1)。
我成功地使用 CUDA 10.0 和 cuDNN 7.6.0 + NCCL 2.4.7 (对于CUDA 10.0)构建了两个TensorFlow版本。 请注意,在构建具有GPU支持的TensorFlow时,无需在机器上连接GPU(尤其是如果您在云中使用VM)。
但是,当我切换到 CUDA 10.1 和cuDNN 7.6.0 + NCCL 2.4.7(对于CUDA 10.1)时,这些TensorFlow版本都无法构建。除了libcublas
的位置变化以外,错误的另一个来源是在libcudart.so*
中找不到cuda-10.1/lib64/
(尽管它们确实存在于cuda-10.0/lib64/
中)。