Question

我正在使用Linux安全模块挂钩为recv（）系统调用添加一些自定义功能。与pristine recv（）相比，我想测量此功能的开销。我编写了一个简单的tcp服务器，我运行和没有我的模块。此tcp服务器调用recv（）函数'N'次。它用以下的方式测量每个recv所用的时间：

clock_gettime(before);
recv()
clock_gettime(after);
global_time += after - before.

最后，我使用“global_time / N”打印单个recv（）的平均时间。让我们把这次称为“user_space_avg_recv”时间。

在我的模块中，我想放置时间测量功能来计算钩子的准确执行时间。我尝试了3种方法。

我使用jiffies如下：
```
sj = jiffies;
my_hook();
ej = jiffies;
current->total_oh = ej - sj;
```
但我发现sj和ej值之间没有区别。因此total_oh没有变化。
我使用了current_kernel_time（），因为我认为它以纳秒为单位返回时间。但是，再一次，之前和之后没有差异。
我使用了get_cycles。我打印进程退出时的总循环数。但是，当我将总周期值转换为毫秒时，它会大得多 “user_space_avg_recv”值。这没有意义，因为内核中的测量值总是小于从用户空间测量的时间值。这可能意味着我要么使用正确的API进行测量，要么在将值从周期转换为毫秒时出错。

我基本上使用以下公式将周期转换为毫秒：

avg overhead of my hook in milliseconds = 
             (((cycles / 2.99) / 10^6) / N)

2.99因为我的时钟频率是2.99Ghz

有些观点：

我的用户空间程序使用set affinity绑定到单个核心。
我使用的是内核2.6.22.14
要在我的钩子内停止内核切换上下文，我使用preempt_disable（）和preempt_enable（）。因此，它不会计算其他内核线程的执行时间。即使这样，由于我的钩子使用了一些I / O，我的线程可能会自动释放控制，或者可能会发生一些可能会增加总周期数的中断。

问题：如何在内核中准确测量函数执行时间？

Answer 1

您可以使用function tracer API来获取所有函数调用和返回的跟踪，并使用高精度时间戳。这包括中断事件和上下文切换。然后，您可以分析用户空间中的结果跟踪，以准确了解函数运行所需的时间。

如果您无法使用函数跟踪器API，则可以调用do_gettimeofday()调用以获得微秒分辨率时间戳，或getnstimeofday()以获得纳秒分辨率。这些是用户空间gettimeofday()调用内部使用的相同功能。当然，对于非常快速的功能，这可能不够准确;比任何更快的准确度，你可能需要深入研究定时器代码，看看它如何实现循环转换。还要注意，仅仅因为它们具有高分辨率并不意味着它们具有那么高的准确性 - 但它们应该用于基准测试目的。

请注意，任何形式的跟踪都会导致额外的延迟 - do_gettimeofday()需要进行大量的原子比较和交换操作，并且ftrace将日志记录代码放在每个函数的前后码上。在解释结果时应该考虑到这一点。

Answer 2

我不确定你会得到你想要的结果，但我们使用以下代码来获得微秒。

double Microsecs()
{
   static struct timeval _t;  
   static struct timezone tz;  
   gettimeofday(&_t, &tz);  
   return   (double)_t.tv_sec + (double)_t.tv_usec/(1000*1000);
}

比你在打电话之前和之后打电话，看看它有多少时间我们一直在使用这种方法来评估IO时间监控读/写/查找操作，以便最大限度地提高性能，并且我们取得了良好的效果。

HTH。

Answer 3

您是否尝试过使用OProfile？

测量linux内核中函数的执行时间

3 个答案: