`gprof`在特定代码行中花费的时间

时间:2012-03-07 20:58:16

标签: c++ profiling gprof

我一直在使用gprof个人资料和g++

我的代码中有一个函数,它封装了几个与主函数相关的行为部分,将它们拆分成自己的函数是没有意义的。

我想知道每个代码区域花了多少时间。

所以,如果你想象代码看起来像

function(){
    A
    A
    A
    B
    B
    B
    C
    C
    C
}

其中A,B和C代表我感兴趣的代码的特定部分,有没有办法让gprof告诉我在这些特定部分上花了多少时间?

3 个答案:

答案 0 :(得分:8)

我知道这是一个老问题,但我找到了一个有趣的答案。 正如Sam所说,-l选项仅适用于旧的gcc编译器。但我发现,如果你编译并链接-pg -fprofile-arcs -ftest-coverage,运行程序,gprof -l的结果非常有趣。

Flat profile:

Each sample counts as 0.01 seconds.
  %   cumulative   self              self     total           
 time   seconds   seconds    calls  Ts/call  Ts/call  name    
 13.86      0.26     0.26                             main (ComAnalyste.c:450 @ 804b315)
 10.87      0.46     0.20                             main (ComAnalyste.c:386 @ 804b151)
  7.07      0.59     0.13                             main (ComAnalyste.c:437 @ 804b211)
  6.25      0.70     0.12                             main (ComAnalyste.c:436 @ 804b425)
  4.89      0.79     0.09                             main (ComAnalyste.c:283 @ 804a3f4)
  4.89      0.88     0.09                             main (ComAnalyste.c:436 @ 804b1e9)
  4.08      0.96     0.08                             main (ComAnalyste.c:388 @ 804ad95)
  3.81      1.03     0.07                             main (ComAnalyste.c:293 @ 804a510)
  3.53      1.09     0.07                             main (ComAnalyste.c:401 @ 804af04)
  3.26      1.15     0.06                             main (ComAnalyste.c:293 @ 804a4bf)
  2.72      1.20     0.05                             main (ComAnalyste.c:278 @ 804a48d)
  2.72      1.25     0.05                             main (ComAnalyste.c:389 @ 804adae)
  2.72      1.30     0.05                             main (ComAnalyste.c:406 @ 804aecb)
  2.45      1.35     0.05                             main (ComAnalyste.c:386 @ 804ad6d)
  2.45      1.39     0.05                             main (ComAnalyste.c:443 @ 804b248)
  2.45      1.44     0.05                             main (ComAnalyste.c:446 @ 804b2f4)
  2.17      1.48     0.04                             main (ComAnalyste.c:294 @ 804a4e4)
  2.17      1.52     0.04                             main (ComAnalyste.c:459 @ 804b43b)
  1.63      1.55     0.03                             main (ComAnalyste.c:442 @ 804b22d)
  1.63      1.58     0.03                             main (ComAnalyste.c:304 @ 804a56d)
  1.09      1.60     0.02                             main (ComAnalyste.c:278 @ 804a3b3)
  1.09      1.62     0.02                             main (ComAnalyste.c:285 @ 804a450)
  1.09      1.64     0.02                             main (ComAnalyste.c:286 @ 804a470)
  1.09      1.66     0.02                             main (ComAnalyste.c:302 @ 804acdf)
  0.82      1.67     0.02                             main (ComAnalyste.c:435 @ 804b1d2)
  0.54      1.68     0.01                             main (ComAnalyste.c:282 @ 804a3db)
  0.54      1.69     0.01                             main (ComAnalyste.c:302 @ 804a545)
  0.54      1.70     0.01                             main (ComAnalyste.c:307 @ 804a586)
  0.54      1.71     0.01                             main (ComAnalyste.c:367 @ 804ac1a)
  0.54      1.72     0.01                             main (ComAnalyste.c:395 @ 804ade6)
  0.54      1.73     0.01                             main (ComAnalyste.c:411 @ 804aff8)
  0.54      1.74     0.01                             main (ComAnalyste.c:425 @ 804b12a)
  0.54      1.75     0.01                             main (ComAnalyste.c:429 @ 804b19f)
  0.54      1.76     0.01                             main (ComAnalyste.c:444 @ 804b26f)
  0.54      1.77     0.01                             main (ComAnalyste.c:464 @ 804b4a1)
  0.54      1.78     0.01                             main (ComAnalyste.c:469 @ 804b570)
  0.54      1.79     0.01                             main (ComAnalyste.c:472 @ 804b5b9)
  0.27      1.80     0.01                             main (ComAnalyste.c:308 @ 804a5a3)
  0.27      1.80     0.01                             main (ComAnalyste.c:309 @ 804a5a9)
  0.27      1.81     0.01                             main (ComAnalyste.c:349 @ 804a974)
  0.27      1.81     0.01                             main (ComAnalyste.c:350 @ 804a99c)
  0.27      1.82     0.01                             main (ComAnalyste.c:402 @ 804af1d)
  0.27      1.82     0.01                             main (ComAnalyste.c:416 @ 804b073)
  0.27      1.83     0.01                             main (ComAnalyste.c:417 @ 804b0a1)
  0.27      1.83     0.01                             main (ComAnalyste.c:454 @ 804b3ec)
  0.27      1.84     0.01                             main (ComAnalyste.c:461 @ 804b44a)
  0.27      1.84     0.01                             main (ComAnalyste.c:462 @ 804b458)

据说每行花费的时间。这是非常有趣的结果。 我不知道它的准确性或有效性,但它非常有趣。 希望它有所帮助

答案 1 :(得分:2)

以下是您的有用资源:gprof line by line profiling

对于旧版本的gcc编译器,gprof -l参数逐行指定。

但是,较新版本的gcc使用gcov工具代替gprof来显示逐行分析信息。

答案 2 :(得分:2)

如果您使用的是linux,那么您可以使用linux perf而不是gprof,如下所述:

http://code.google.com/p/jrfonseca/wiki/Gprof2Dot#linux_perf

键入perf report并选择一个函数将允许您获取有关在函数内部花费CPU时间的位置的逐行信息。