使用waitpid pselect fork sigaction处理程序清理子进程

时间:2014-08-16 10:29:10

标签: c select fork zombie-process waitpid

我有一个服务器将消息接收到套接字中,对于收到的每条消息,请执行fork exec。这部分似乎运作正常。

但我需要在非阻塞模式下执行此操作,因此我创建了一个处理程序,以使用waitpid()正确清理所有已终止的子进程(如论坛中的许多主题中所述)。

问题是这个处理程序生成对我的pselect命令的中断系统调用,并使用以下消息停止程序:
"select(): Interrupted system call"

我在“预防竞争条件”等论坛中找到了对此问题的一些解释,所以我尝试使用sigprocmask()来阻止多个信号,但它没有用。

我确信这是一个微不足道的问题,但这是我第一次使用这种程序。

我需要一些帮助。 提前谢谢。

以下是该计划:

void
clean_up_child_process (int signal_number)
{

  pid_t p;
  int status;

  while (1)
    {
      p = waitpid (-1, &status, WNOHANG);

      if (p == -1)
        {
          if (errno == EINTR)
            {
              continue;
            }
          break;
        }
      else if (p == 0)
        {
          break;
        }
    }


}

static void
app (void)
{
  SOCKET sock;
  char commande[BUF_SIZE];
  char res_cmd[BUF_SIZE];
  int max;
  int n;

  sock = init_connection ();
  max = sock;
  fd_set rdfs;

  sigemptyset (&sigmask);
  sigaddset (&sigmask, SIGCHLD);
  sigaddset (&sigmask, SIGINT);
  sigaddset (&sigmask, SIGTSTP);
  sigaddset (&sigmask, SIGTERM);
  sigprocmask (SIG_BLOCK, &sigmask, NULL);

  struct sigaction sigchld_action;
  memset (&sigchld_action, 0, sizeof (sigchld_action));
  sigchld_action.sa_handler = &clean_up_child_process;
  sigaction (SIGCHLD, &sigchld_action, NULL);

  while (1)
    {
      int i = 0;
      FD_ZERO (&rdfs);

      /* add STDIN_FILENO */
      FD_SET (STDIN_FILENO, &rdfs);

      /* add the connection socket */
      FD_SET (sock, &rdfs);

      sigemptyset (&empty_mask);
      if (pselect (max + 1, &rdfs, NULL, NULL, NULL, &empty_mask) == -1)
        if (errno != EINTR)
          {
            perror ("select()");
            exit (errno);
          }

      if (FD_ISSET (STDIN_FILENO, &rdfs))
        {
          /* stop process when type on keyboard */
          // break; must be disable to avoid bad exits
        }
      else if (FD_ISSET (sock, &rdfs))
        {
          /* new client */
          SOCKADDR_IN csin = { 0 };
          size_t sinsize = sizeof csin;
          int csock = accept (sock, (SOCKADDR *) & csin, &sinsize);
          if (csock == SOCKET_ERROR)
            {
              perror ("accept()");
              continue;
            }

          if ((n = recv (csock, commande, BUF_SIZE - 1, 0)) < 0)
            {
              perror ("recv(commande)");
              n = 0;
              continue;
            }
          commande[n] = 0;
          if ((n = fork ()) == -1)
            perror ("fork()");
          else if (n == 0)
            {
              close (STDOUT_FILENO);
              dup (csock);
              close (STDERR_FILENO);
              dup (csock);
              execlp (commande, commande, 0);
            }
          else
            {
              closesocket (csock);
            }
        }
    }
  end_connection (sock);
}

1 个答案:

答案 0 :(得分:0)

您需要了解有关POSIX信号处理的更多信息。

当在可中断的系统调用期间(在此实例中为pselect)接收到信号时,信号调用将退回到用户空间并调用信号处理程序。信号处理程序完成后,正常行为是信号调用返回EINTR。在某些系统上,可以通过发出信号动作SA_RESTART来避免这种情况,在这种情况下,内核将自动重启系统调用。这听起来是一个很好的选择,直到你意识到你经常要捕获像SIGINT这样的信号并让它们设置一个全局变量(例如退出程序)并测试它。因此,如下所示的结构(适用于您的程序)很常见:

volatile sig_atomic_t rxsig_quit = 0;

void
handlesignal (int sig)
{
  /* Only do signal safe things here; remember mutexes may be held */
  switch (sig)
    {
    case SIGINT:
    case SIGTERM:
      rxsig_quit++;
      break;
    case SIGCHLD:
      /* do all our waiting here */
      while (1)
        {
          int status;
          waitpid (WAIT_ANY, &status, WNOHANG);
        }
      break;
    }
}

static void
app (void)
{

  /* ... */

  while (!rxsig_quit)
    {
      /* ... */

      do
        {
          int ret;
          ret = pselect (max + 1, &rdfs, NULL, NULL, NULL, &empty_mask);
        }
      while ((ret < 0) && (errno == EINTR) && !rxsig_quit);

      /* ... */
    }

  /* ... */
}

您可以使用man -s7 signal获取更多信息。这也列出了异步安全函数,IE可以在信号处理程序中安全地调用的函数。

但是,您假设您需要完成wait。在现代POSIX系统上,情况并非如此。您可以将SIGCHLD设置为SIG_IGN,在这种情况下操作系统将按照wait(2)的联机帮助页中的此段落进行操作:

  

POSIX.1-2001指定如果SIGCHLD的处理设置为SIG_IGN,或者SA_NOCLDWAIT的{​​{1}}标记已设置为SIGCHLD(请参阅sigaction(2) ),然后终止的孩子不会变成僵尸,并且对wait()waitpid()的调用将阻止,直到所有孩子都已终止,然后将errno设置为ECHILD失败。 (原始POSIX标准留下了将SIGCHLD设置为SIG_IGN未指定的行为。请注意,即使SIGCHLD的默认处置为“忽略”,也明确将处置设置为{{1}导致对僵尸进程子进行不同处理。)Linux 2.6符合此规范。但是,Linux 2.4(及更早版本)不会:如果在忽略SIG_IGN时进行wait()或waitpid()调用,则调用的行为就像SIGCHLD未被忽略一样,也就是说,调用会阻塞,直到下一个子节点终止,然后返回该子节点的进程ID和状态。

显然这不太便于携带。

相关问题