perf stat前端和后端周期显示大于100%

时间:2014-11-14 14:24:57

标签: c profiling x86-64 perf

我正在尝试使用perf对使用C语言编写的代码进行基准测试,并且在前端空闲周期计数中获得超过100%。我已经看到这种情况发生在后端空闲周期计数中。两者都超过100个。每个周期的指令数量相当高 - 范围从5 - 10

3,569,966 stalled-cycles-frontend   #  111.98% frontend cycles idle   
1,843,327 stalled-cycles-backend    #   57.82% backend  cycles idle   
17,875,020 instructions             #    5.61  insns per cycle        
                                    #    0.20  stalled cycles per insn

百分比如此之高是什么意思?

1 个答案:

答案 0 :(得分:0)

这些百分比与活动CPU周期有关,显示为cycles。因此,cycles不是总周期,而是活动CPU周期,并且相对于它计算前端或后端停顿周期。