Tensorflow 1.12与CUDA 10.1兼容吗?

时间:2019-02-28 19:19:46

标签: tensorflow nvidia ubuntu-18.04

我已经能够使用nvidia-smi 418.39,驱动程序版本418.39和CUDA 10.1成功设置Ubuntu 18.04服务器

我现在有一个用户想要运行TensorFlow,但坚持认为它与CUDA 10.1不兼容,仅与CUDA 10不兼容。在我可以找到的任何地方,都没有在线确认这一点的声明,也没有来自任何发行补丁说明的声明。 TF。因为设置此系统有点麻烦,所以我有点犹豫,只尝试降级一个版本。

有人可以验证TensorFlow 1.12是否与CUDA 10.1一起使用吗?

3 个答案:

答案 0 :(得分:5)

我可以确认,即使tf 1.13.1对我来说也只能使用CUDA 10.0,而不是10.1。 不知道symlink是否可以正常工作。 如果您尝试在CUDA 10.1上运行tf 1.13.1,它将显示“ ImportError:libcublas.so.10.0:无法打开共享库文件:没有此类文件或目录”

答案 1 :(得分:1)

我还可以确认tf 1.13.1不适用于CUDA 10.1。导入tensorflow时会出现以下错误

ImportError:libcublas.so.10.0:无法打开共享对象文件:没有这样的文件或目录

运行ldconfig -v显示差异 libcublas.so.10.0和libcublas.so.10.1.0.105

答案 2 :(得分:0)

TensorFlow 1.12(甚至更高的版本1.13.1和2.0.0-alpha0)可能 不是针对CUDA 10.1构建的,因此可以认为是不兼容的。

我尝试从具有GPU支持的源代码构建TensorFlow。我考虑的TensorFlow版本为 1.13.1 2.0.0-alpha0 。我使用的机器在GCC 4.8.5上运行CentOS 7.6。我安装了NVIDIA驱动程序版本 418.67 (发行日期为2019.5.7,并支持CUDA Toolkit 10.1)。

我成功地使用 CUDA 10.0 cuDNN 7.6.0 + NCCL 2.4.7 (对于CUDA 10.0)构建了两个TensorFlow版本。 请注意,在构建具有GPU支持的TensorFlow时,无需在机器上连接GPU(尤其是如果您在云中使用VM)。

但是,当我切换到 CUDA 10.1 和cuDNN 7.6.0 + NCCL 2.4.7(对于CUDA 10.1)时,这些TensorFlow版本都无法构建。除了libcublas的位置变化以外,错误的另一个来源是在libcudart.so*中找不到cuda-10.1/lib64/(尽管它们确实存在于cuda-10.0/lib64/中)。