Question

我正在努力弄清楚如何将代码与OpenMP并行化，我们将提供任何帮助。下面是基本代码和说明。

在模拟一组柔软的粒子（例如流体中的蛋白质）时，当一对粒子重叠时，它们之间会产生排斥力。这项任务的目标是使用并行计算来加速计算这些排斥力，并使用带有Open-MP的多个核。

在推斥力函数中，假定粒子具有单位半径。粒子位于尺寸为L×L×L的“模拟盒”中。选择尺寸L时，粒子的体积分数为φ= 0.3。模拟框具有周期性（环绕）边界条件，这说明了为什么我们需要使用余数函数来计算两个粒子之间的距离。如果粒子重叠，即两个粒子之间的距离s小于2，则排斥力与k（2-s）成比例，其中k为力常数。力沿着将两个粒子连接在一起的向量。

编写一个程序来测试代码的正确性。这可以通过计算正确的力并将它们与优化代码计算出的力进行比较来完成。在报告中提供证据，表明您使用测试程序可以正常运行程序
与提供的基准代码相比，加速代码要快多少？包括针对不同问题大小的时间安排。确保在报告中包含代码清单。

要并行化的代码

#include <stdlib.h>
#include <stdio.h>
#include <math.h>
#include <sys/time.h>

double get_walltime() {
struct timeval tp;
gettimeofday(&tp, NULL);
return (double) (tp.tv_sec + tp.tv_usec*1e-6); }

void force_repulsion(int np, const double *pos, double L, double     krepulsion, double *forces)
{
int i, j;
 double posi [4]; double rvec [4];
 double s2, s, f;
 // initialize forces to zero
for (i=0; i<3*np; i++)
 forces[i] = 0.;
 // loop over all pairs
for (i=0; i<np; i++)
 {
posi[0] = pos[3*i ];
posi[1] = pos[3*i+1]; posi[2] = pos[3*i+2];
for (j=i+1; j<np; j++)
 {
// compute minimum image difference
 rvec[0] = remainder(posi[0] - pos[3*j ], L);
 rvec[1] = remainder(posi[1] - pos[3*j+1], L);
 rvec[2] = remainder(posi[2] - pos[3*j+2], L);
 s2 = rvec [0]* rvec [0] + rvec [1]* rvec [1] + rvec [2]* rvec [2];
 if (s2 < 4)
 {
 s = sqrt(s2);
 rvec[0] /= s; rvec[1] /= s;
 rvec[2] /= s;
 f = krepulsion*(2.-s);
 forces[3*i ] += f*rvec[0];
 forces[3*i+1] += f*rvec[1];
 forces[3*i+2] += f*rvec[2];
 forces[3*j ] += -f*rvec[0];
 forces[3*j+1] += -f*rvec[1];
 forces[3*j+2] += -f*rvec[2]; }
 } }
 }


 int main(int argc, char *argv[]) {
 int i;
 int np = 100; // default number of particles
 double phi = 0.3; // volume fraction
 double krepulsion = 125.; // force constant
 double *pos; double *forces;
 double L, time0 , time1;

if (argc > 1)
np = atoi(argv[1]);

L = pow(4./3.*3.1415926536*np/phi, 1./3.);
 // generate random particle positions inside simulation box
forces = (double *) malloc(3*np*sizeof(double));
pos = (double *) malloc(3*np*sizeof(double));
for (i=0; i<3*np; i++)
  pos[i] = rand()/(double)RAND_MAX*L;
// measure execution time of this function

time0 = get_walltime ();
force_repulsion(np, pos, L, krepulsion, forces);
time1 = get_walltime ();

printf("number of particles: %d\n", np);
printf("elapsed time: %f\n", time1-time0);
free(forces);
free(pos);
return 0; }

Answer 1

从理论上讲，它就像这样简单：

void force_repulsion(int np, const double *pos, double L, double krepulsion, 
 double *forces)
{

   // initialize forces to zero
   #pragma omp parallel for
   for (int i = 0; i < 3 * np; i++)
     forces[i] = 0.;
   // loop over all pairs
   #pragma omp parallel for
   for (int i = 0; i < np; i++)
   {
    double posi[4];
    double rvec[4];
    double s2, s, f;

    posi[0] = pos[3 * i];
    //...

编译：

g++ -fopenmp example.cc -o example

请注意，我没有检查正确性。确保您在并行操作中没有全局变量（因为我更新了代码。）

使用带有Open-MP的多个内核的并行计算。

1 个答案: