有没有办法要求GPU(或驱动程序)在GPU上列出一组活动(或调度或发布)的CUDA内核,而不将cuda-gdb
附加到拥有的CPU进程并暂停它?
我想象pstack之类的东西,界面可能是这样的:
> list-cuda-kernels $pid
gpu 0: kernel_foo
gpu 0: kernel_bar
gpu 1: kernel_baz
答案 0 :(得分:2)
除了cuda-gdb(或任何其他CUDA调试器)之外,没有工具或API可以获取当前运行的内核列表。