openAcc如何配置文件

时间:2013-03-13 10:35:16

标签: gpu openacc

您好我使用的是CAPS OpenACC编译器,但是当我尝试获得一些初步的个人资料结果时会出现一些问题。

首先,我通过声明HMPPRT_LOG_LEVEL =“info”运行代码,生成一些带有时间戳的配置文件结果。

[     2.612337] ( 0) INFO : Upload   edgelengths[0:129600] (element_size=8, queue=none, location=gravity_openacc.c:50)
[     2.613485] ( 0) INFO : Call     __hmpp_acc_region__2ha750yb (queue=none, location=gravity_openacc.c:50)
[     2.614367] ( 0) INFO : Free     edgelengths[0:129600] (element_size=8, queue=none, location=gravity_openacc.c:50)

所以我猜内核执行时间计算为2.614367-2.613485 = 0.000882 s。

但是当我声明CUDA_PROFILE = 1时,显示下面的配置文件

method=[ __hmpp_acc_region__2ha750yb_parallel_region_1 ] gputime=[ 492.480 ] cputime=[ 13.000 ] occupancy=[ 0.250 ] 

所以我对这两个结果很困惑,这是真的???

有人得到一些解决方案吗?

谢谢!

1 个答案:

答案 0 :(得分:0)

CUDA探查器只显示执行CUDA内核所需的时间,而使用HMPPRT_LOG_LEVEL =“info”获取的日志会显示执行该区域所需的总时间,这不完全相同,因为你可能有一些在主机上执行的代码。

相关问题