C for循环优化

时间:2018-07-15 18:06:58

标签: c for-loop optimization

我正在尝试学习如何优化我的c代码,因此我在互联网上找到了一些文章,并对我的函数进行了重新制作,使其可以更快地执行。当我在不使用优化标志的情况下进行编译时,它可以工作(第二个函数比第一个函数快约12%),但是当我将其与gcc -O3一起使用时,第二个函数要慢得多(约50%)。你知道为什么吗? 感谢您的帮助。

第一个功能:

typedef struct {
    double *data;
    int rows;
    int columns;
} Matrix;

Matrix *matrixMultiplication(Matrix *a, Matrix *b) {
    if(a->columns != b->rows)
        return NULL;
    Matrix *matrix = createMatrix(a->rows, b->columns);
    set(0, matrix);
    for(int i = 0; i < matrix->rows; i++) {
        for(int j = 0; j < a->columns; j++) {
            for(int k = 0; k < b->columns; k++) {
                matrix->data[i * matrix->columns + k] += a->data[i * a->columns + j] * b->data[j * b->columns + k];
            }
        }
    }
    return matrix;
}

第二功能:

typedef struct {
    float *data;
    unsigned int rows;
    unsigned int columns;
} Matrix_2;

unsigned int matrixMultiplication_2(Matrix_2 *a, Matrix_2 *b, Matrix_2 **c) {
    Matrix_2 *matrix;
    if(a->columns != b->rows)
        return 0;
    createMatrix_2(a->rows, b->columns, &matrix);
    set_2(0, matrix);
    for(unsigned int i = matrix->rows; i--;) {
        for(unsigned int j = a->columns; j--;) {
            for(unsigned int k = b->columns; k--;) {
                matrix->data[i * matrix->columns + k] += a->data[i * a->columns + j] * b->data[j * b->columns + k];
            }
        }
    }
    *c = matrix;
    return 1;
}

1 个答案:

答案 0 :(得分:5)

那是因为编译器优化基于模式识别。您的编译器知道很多典型的代码模式,并且知道如何转换它们以产生更快的代码。但是,尽管此代码模式库相当广泛,但它是有限的。

第一个函数使用规范的for(int i = 0; i < count; i++)循环控制。您可以打赌,任何值得赞扬的编译器都会为此提供模式,从而为循环控制产生接近最佳的代码。

第二个函数使用的模式在人工代码中很少见。尽管我个人很喜欢这种模式的简洁性,但仍有许多程序员认为它过于神秘而无法使用。显然,您的编译器没有为此提供优化器模式,因此生成的代码不会得到完全优化。


当C仍然只是高级汇编程序时,诸如将for(int i = 0; i < count; i++)替换为for(int i = count; i--;)这样的优化非常有用。但是长期以来,编译器优化已将代码转换变成过于复杂的野兽,无法通过此类技巧进行优化。今天,大多数优化都需要在算法层面上完成。通常应将翻译级别的优化留给编译器,并通过编写编译器可以优化的规范代码来促进。

相关问题