在Turing GPU上使用Nsight无法达到内核内部的断点

时间:2020-01-09 19:27:47

标签: visual-studio cuda nsight

我的计算机的设置是:

操作系统:Windows 10

IDE:Visual Studio 2019(和2015年)

GPU:Quadro 4000 RTX

NVIDIA驱动程序软件包:441.22 Drivers for use with the CUDA Toolkit 10.2,包括Nsight 2019.4

我打开了一个名为“ matrixMul”的CUDA示例项目,并在内核内部设置了断点

template <int BLOCK_SIZE> __global__ void MatrixMulCUDA(float *C, float *A,
                                                        float *B, int wA,
                                                        int wB)

但是,如果我“启动CUDA Debbugging(下一代)”,则会收到错误消息“无法为指定的CUDA Debugger初始化驱动程序。调试已自动停止。”

enter image description here

enter image description here

如果我“开始CUDA调试(旧版)”,则会收到错误消息“在旧CUDA调试器不支持的GPU上创建了CUDA上下文。将禁用断点。有关详细信息,请参见输出窗口。 “。

enter image description here

我现在很困惑。在Nsight 6.5中使用传统调试时,我从来没有遇到过这样的问题。

请告知。

1 个答案:

答案 0 :(得分:2)

如注释中所指出的,如果此卡未设置为TCC模式,则无法将其用于Windows中使用下一代调试(图灵卡支持的所有功能)的CUDA调试。

我的解决方案是我在计算机上添加了另一块NVIDIA卡专门用于显示,因此我的Quadro 4000 RTX可以专注于计算(TCC模式)。现在可以正常使用了。

相关问题