Segfault用于OMP并行循环

时间:2019-05-11 20:59:21

标签: segmentation-fault openmp

我有2d浮点数组,我想对每一行的索引进行排序。我使用一个函数进行排序。我遍历数组的行,并为每行调用sort函数。我只希望此函数调用可以并行执行。串行版本工作正常。但是当我使用omp parallel时,会出现段错误。我已经尝试过对变量进行私有化,并且使几个循环变得很关键,但我仍然无法理解此错误的起因。任何帮助将非常感激。

到目前为止,我的代码如下:

#include <stdio.h>
#include <stdlib.h>
#include <omp.h>
void QuickSort(float A[], size_t I[], size_t lo, size_t hi)
{
   while (lo < hi)
   {
      float pivot = A[I[lo + (hi - lo) / 2]];
      size_t t;
      size_t i = lo - 1;
      size_t j = hi + 1;
      while (1)
      {
         while (A[I[++i]] < pivot);
         while (A[I[--j]] > pivot);
         if (i >= j)
            break;
         t = I[i];
         I[i] = I[j];
         I[j] = t;
      }
    /* avoid stack overflow */
      if((j - lo) < (hi - j)){
         QuickSort(A, I, lo, j);
         lo = j+1;
      } else {
         QuickSort(A, I, j + 1, hi);
         hi = j;
      }
   }
}
//Declare number of data points
#define COUNT (10)             

int main(int argc, char**argv)
{
   int  i,j;
   //Index array for every row
   size_t I[COUNT] ;
   //Array to keep first 5 sorted indices for every row
   size_t I_sorted[COUNT][5];
   //Array to fill random values, and random float variable        
   float fr, A[COUNT][COUNT], B[COUNT] ;
   srand((unsigned)time(NULL));

   //Fill random float 2d array  of COUNT*COUNT dimentions
   for(i = 0; i < COUNT; i++) {         // array of indexes
      for(j=0; j<COUNT ;j++){
         fr =  (float)rand()/RAND_MAX;
         A[i][j] = fr;
         printf("%f\t",A[i][j]);
        }
        printf("\n");
   }

   //Need to call QuickSort count number of times in parallel
   #pragma omp parallel for private(j)
   for(i=0 ;i<COUNT; i++) {
   //#pragma omp critical
   //Assign a row of A to B to pass for sorting, also make index array
      for(j=0 ;j<COUNT; j++) {
         B[j] = A[i][j];
         I[j] = j;
      }
      //Sort row indices
      QuickSort(B, I, 0, COUNT-1);
      //#pragma omp critical
      //Store sorted indices
         for(j=0;j<4; j++) {
            I_sorted[i][j] = I[j];
            //printf("%d\t",I_sorted[i][j]);
         }
      //printf("\n");
    }

    //Verify sorted array is correct
    printf("------------------------\n");
    for(i = 0; i < COUNT; i++) {
       for(j = 0; j < 4; j++) {
          printf("%d\t",I_sorted[i][j]);
       }
       printf("\n");
    }

    return(0);
    }

串行代码可以正常工作,但使用fopenmp进行编译会产生segfault。

1 个答案:

答案 0 :(得分:0)

让我们考虑两个线程的情况。 for(i=0; i<COUNT; i++)循环将分为两部分:一个线程将为i ... 0范围内的COUNT/2个值工作,第二个线程将为{{1} }值在i ... COUNT/2+1范围内。这两个线程将在同一时间执行,并且您必须没有任何共享内存区域要从两个线程写入而无需同步。 (如果他们确实写入相同的地址,则该地址将为https://en.wikipedia.org/wiki/Race_condition,这会使程序无法预测。)

您的代码具有数组COUNT,两个线程共享并对其进行修改。此同时访问是不正确的。尝试使用局部数组(在并行循环的B的{​​{1}}块中定义some docs),并检查其他变量以从两个线程进行写访问。