我想拦截NVIDIA GPU上的openx程序的PTX级别。
我想这个例程可能看起来像这样。
首先,我编写一个opencl程序(主机和设备代码),使用NVIDIA编译器生成相应的ptx代码。然后我通过修改PTX代码来编写我想要做的事情(请不要问为什么我没有在设备C代码上执行此操作 - 我有一些理由)。但问题是,在修改之后,如何将此PTX代码编译为二进制代码?
答案 0 :(得分:1)
您可以使用ptxas,它包含在CUDA工具包中。它将.ptx编译成.cubin,然后可以使用驱动程序API加载。