Linux中进程和线程之间的区别

时间:2012-02-06 01:22:11

标签: c linux multithreading

在阅读了Robert Love的this answer和“Linux内核开发”之后,随后在clone()系统调用中,我发现Linux中的进程和线程(几乎)无法区分核心。他们之间有一些调整(在引用的SO问题中被讨论为“更多共享”或“更少共享”),但我仍然有一些问题尚未得到解答。

我最近参与了一个涉及几个POSIX线程的程序,并决定在这个前提下进行实验。在创建两个线程的进程中,所有线程当然都会获得pthread_self()返回的唯一值,但是,而不是getpid()

我创建的示例程序如下:

#include <stdio.h>
#include <stdlib.h>
#include <stdint.h>
#include <unistd.h>
#include <pthread.h>

void* threadMethod(void* arg)
{
    int intArg = (int) *((int*) arg);

    int32_t pid = getpid();
    uint64_t pti = pthread_self();

    printf("[Thread %d] getpid() = %d\n", intArg, pid);
    printf("[Thread %d] pthread_self() = %lu\n", intArg, pti);
}

int main()
{
    pthread_t threads[2];

    int thread1 = 1;

    if ((pthread_create(&threads[0], NULL, threadMethod, (void*) &thread1))
         != 0)
    {
        fprintf(stderr, "pthread_create: error\n");
        exit(EXIT_FAILURE);
    }

    int thread2 = 2;

    if ((pthread_create(&threads[1], NULL, threadMethod, (void*) &thread2))
         != 0)
    {
        fprintf(stderr, "pthread_create: error\n");
        exit(EXIT_FAILURE);
    }

    int32_t pid = getpid();
    uint64_t pti = pthread_self();

    printf("[Process] getpid() = %d\n", pid);
    printf("[Process] pthread_self() = %lu\n", pti);

    if ((pthread_join(threads[0], NULL)) != 0)
    {
        fprintf(stderr, "Could not join thread 1\n");
        exit(EXIT_FAILURE);
    }

    if ((pthread_join(threads[1], NULL)) != 0)
    {
        fprintf(stderr, "Could not join thread 2\n");
        exit(EXIT_FAILURE);
    }

    return 0;
}

(这是在64位Fedora上编译的[gcc -pthread -o thread_test thread_test.c];由于用于pthread_t的{​​{1}}的64位类型,代码将需要进行微小的更改才能编译在32位版本上。)

我得到的输出如下:

<bits/pthreadtypes.h>

通过在[bean@fedora ~]$ ./thread_test [Process] getpid() = 28549 [Process] pthread_self() = 140050170017568 [Thread 2] getpid() = 28549 [Thread 2] pthread_self() = 140050161620736 [Thread 1] getpid() = 28549 [Thread 1] pthread_self() = 140050170013440 [bean@fedora ~]$ 中使用调度程序锁定,我可以使程序及其线程保持活动状态,以便我可以捕获gdb所说的内容,只是显示进程,它是:

top

当显示线程时,说:

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
28602 bean      20   0 15272 1112  820 R  0.4  0.0   0:00.63 top
 2036 bean      20   0  108m 1868 1412 S  0.0  0.0   0:00.11 bash
28547 bean      20   0  231m  16m 7676 S  0.0  0.4   0:01.56 gdb
28549 bean      20   0 22688  340  248 t  0.0  0.0   0:00.26 thread_test
28561 bean      20   0  107m 1712 1356 S  0.0  0.0   0:00.07 bash

似乎很清楚程序,或者内核,有一种与流程形成对比的独特方式来定义线程。根据{{​​1}},每个线程都有自己的PID - 为什么?

3 个答案:

答案 0 :(得分:29)

这些混淆都源于这样一个事实:内核开发人员最初持有一种非理性和错误的观点,即线程可以使用内核进程作为原语几乎完全在用户空间中实现,只要内核提供了一种使它们共享内存的方法和文件描述符。这导致了众所周知的糟糕的LinuxThreads POSIX线程的实现,这是一个误称,因为它没有给出任何与POSIX线程语义类似的东西。最终LinuxThreads被NPTL取代了,但很多令人困惑的术语和误解仍然存在。

要实现的第一个也是最重要的事情是“PID”在内核空间和用户空间中意味着不同的东西。内核调用PID实际上是内核级线程ID(通常称为TID),不要与pthread_t混淆,main是一个单独的标识符。系统中的每个线程,无论是在同一进程中还是在不同的进程中,都具有唯一的TID(或内核术语中的“PID”)。

另一方面,POSIX意义上的“进程”中的PID被称为内核中的“线程组ID”或“TGID”。每个进程由一个或多个线程(内核进程)组成,每个线程都有自己的TID(内核PID),但都共享相同的TGID,这等于top的初始线程的TID(内核PID)运行。

当{{1}}显示线程时,它显示TID(内核PID),而不是PID(内核TGID),这就是每个线程都有一个单独的线程的原因。

随着NPTL的出现,大多数采用PID参数或作用于调用进程的系统调用被更改为将PID视为TGID并作用于整个“线程组”(POSIX)处理)。

答案 1 :(得分:1)

想象一下某种“元实体”。如果实体不共享其父级的资源(地址空间,文件描述符等),那么它就是一个进程,如果实体共享其父级的所有资源,那么它就是一个线程。你甚至可以在进程和线程之间有一些东西(例如,一些资源共享,一些不共享)。看一下“clone()”系统调用(例如http://linux.die.net/man/2/clone),你就会发现这就是Linux内部工作的方式。

现在隐藏在某种抽象背后,使一切看起来像一个进程或一个线程。如果抽象是完美的,你永远不会知道“实体”和“进程和线程”之间的区别。虽然抽象并不完美 - 你所看到的PID实际上是一个“实体ID”。

答案 2 :(得分:0)

在Linux上,每个线程都获得线程ID 。主线程的线程ID作为进程ID提供双重任务(并且在用户界面中是众所周知的)。线程ID是Linux的实现细节,与POSIX ID无关。有关更多详细信息,请参阅gettid系统调用(不适用于纯Python,因为它是特定于系统的)。