无论如何要避免cuda剖析中的这种序列化行为?

时间:2013-01-23 00:39:32

标签: cuda nvvp

根据CUDA streams not overlapping,“探查器将序列化流以获得准确的时序数据”。 现在的问题是,无论如何要避免cuda性能分析中的这种序列化行为(例如nvvp)? 我正在使用Fermin M2090和cuda-4.0。

1 个答案:

答案 0 :(得分:3)

Visual Profiler 5.0(包括nvprof和CUPTI)和Nsight Visual Studio Edition 2.0及更高版本(> 2岁)支持Fermi和Kepler设备的并发内核跟踪。