进程last-request-cpu的PHP-FPM池状态

时间:2014-12-12 09:58:50

标签: php c php-extension php-internals

我已经安装了PHP并启用了FPM功能,但我对FPM状态数据感觉不确定(比如进程last-request-cpu),下面是我的php-fpm.conf详细信息。

[www]
; Unix user/group of processes
user = www-data
group = www-data

; Chdir to this directory at the start.
chdir = /

; The address on which to accept FastCGI requests.
listen = /var/run/phpfpm/$pool_php5-fpm.sock

; Set listen(2) backlog. A value of '-1' means unlimited.
listen.backlog = -1

; Set permissions for unix socket.
listen.mode = 0666

; Pool configuration.
pm = dynamic
pm.max_children = 10
pm.start_servers = 4
pm.min_spare_servers = 2
pm.max_spare_servers = 6
pm.max_requests = 500

; The URI to view the FPM status page.
pm.status_path = /status

; The ping URI to call the monitoring page of FPM.
ping.path = /ping

; The access log file.
access.log = /var/log/phpfpm/$pool_php-fpm.access.log

; The access log format.
access.format = %R - %u %t "%m %r%Q%q" %s %f %{mili}d %{kilo}M %C%%

; The log file for slow requests.
slowlog = /var/log/phpfpm/$pool_php-fpm.log.slow

; The timeout for serving a single request after which a PHP backtrace will be
; dumped to the 'slowlog' file. A value of '0s' means 'off'.
request_slowlog_timeout = 5

; Limits the extensions of the main script FPM will allow to parse.
security.limit_extensions = .php

我已启用pm.status_path = / status以查看FPM状态结果,如下所示:

<?xml version="1.0" ?>
<status>
<pool>www</pool>
<process-manager>dynamic</process-manager>
<start-time>1418352728</start-time>
<start-since>21936</start-since>
<accepted-conn>20</accepted-conn>
<listen-queue>0</listen-queue>
<max-listen-queue>0</max-listen-queue>
<listen-queue-len>0</listen-queue-len>
<idle-processes>3</idle-processes>
<active-processes>1</active-processes>
<total-processes>4</total-processes>
<max-active-processes>1</max-active-processes>
<max-children-reached>0</max-children-reached>
<slow-requests>0</slow-requests>
<processes>
<process>
    <pid>11</pid>
    <state>Idle</state>
    <start-time>1418352728</start-time>
    <start-since>21936</start-since>
    <requests>5</requests>
    <request-duration>5391</request-duration>
    <request-method>GET</request-method>
    <request-uri>/status?xml&amp;full</request-uri>
    <content-length>0</content-length>
    <user>-</user><script>-</script>
    <last-request-cpu>0.00</last-request-cpu>
    <last-request-memory>262144</last-request-memory>
</process>
<process>
    <pid>12</pid>
    <state>Idle</state>
    <start-time>1418352728</start-time>
    <start-since>21936</start-since>
    <requests>5</requests>
    <request-duration>3365</request-duration>
    <request-method>GET</request-method>
    <request-uri>/status?xml&amp;full</request-uri>
    <content-length>0</content-length>
    <user>-</user><script>-</script>
    <last-request-cpu>297.18</last-request-cpu>
    <last-request-memory>262144</last-request-memory>
</process>
</processes>
</status>

我不知道为什么元素last-request-cpu值297.18超过100,我想知道如何使用它作为监控信息.. 感谢

1 个答案:

答案 0 :(得分:4)

该指标将告知上一次请求中使用的cpu time总数的百分比。

  

CPU时间(或处理时间)是中央处理单元(CPU)用于处理计算机程序或操作系统的指令的时间量,而不是例如等待输入/输出( I / O)操作或进入低功耗(空闲)模式。 CPU时间以时钟周期或秒计算。

因此,不会按照本页其他地方的建议以毫秒为单位进行衡量。

您可以在

看到实施

相关部分是这样的(为了便于阅读而重新格式化):

431    if (proc.cpu_duration.tv_sec == 0 && proc.cpu_duration.tv_usec == 0) {
432        cpu = 0.;
433    } else {
434        cpu = (proc.last_request_cpu.tms_utime 
                + proc.last_request_cpu.tms_stime 
                + proc.last_request_cpu.tms_cutime 
                + proc.last_request_cpu.tms_cstime) 
                / fpm_scoreboard_get_tick() 
                / (proc.cpu_duration.tv_sec 
                + proc.cpu_duration.tv_usec / 1000000.) 
                * 100.;
435    }

struct members for tms proc.last_request_cpu定义为:

  
      
  • tms_utime结构成员是执行调用进程的用户指令所需的CPU时间。
  •   
  • tms_stime结构成员是系统代表调用进程执行的CPU时间。
  •   
  • tms_cutime结构成员是子进程的tms_utimetms_cutime次的总和。
  •   
  • tms_cstime结构成员是子进程的tms_stimetms_cstime次的总和。
  •   

所以这意味着我们将在上一个请求中收取的所有可能的cpu时间相加。所有时间都是根据使用的时钟周期数来衡量的。

fpm_scoreboard_get_tick功能只会返回每秒ticks的可能数量,例如how many instructions your computer can do at max per second per core.

struct members for the timeval proc.cpu_duration定义为:

  
      
  • time_t tv_sec:这表示经过时间的整秒数。
  •   
  • long int tv_usec:这是剩余的经过时间(几分之一秒),表示为微秒数。它总是不到一百万。
  •   

这是以秒为单位的经过时间,包括任何分数,例如像2.456435663。

然后将该值乘以100以获得百分比值。

示例:

假设我们的最后一个请求在5秒内总共烧掉了350个滴答。我们还假设我们每秒的最大刻度为100.如果我们将这些数字放在上面的等式中,我们得到

 (350 / 100 / 5) * 100 = 70

这意味着上一次请求占用了70%的可用CPU时间。

您获得高于100%的值的原因是因为每秒滴答数的值不受您拥有的核心数的影响,而proc.last_request_cpu值将返回所有进程的滴答计数,例如访问数据库或某些其他数据源可能在另一个进程中发生,但直接受PHP执行的代码的影响。所以这里考虑到这一点。