堆栈变量是否由GCC __attribute __((aligned(x)))对齐?

时间:2009-05-08 19:34:55

标签: c memory gcc alignment

我有以下代码:

#include <stdio.h>

int
main(void)
{
        float a[4] __attribute__((aligned(0x1000))) = {1.0, 2.0, 3.0, 4.0};
        printf("%p %p %p %p\n", &a[0], &a[1], &a[2], &a[3]);
}

我有以下输出:

0x7fffbfcd2da0 0x7fffbfcd2da4 0x7fffbfcd2da8 0x7fffbfcd2dac

为什么a[0]的地址不是0x1000的倍数?

究竟__attribute__((aligned(x)))到底是什么?我误解了this解释?

我正在使用gcc 4.1.2。

4 个答案:

答案 0 :(得分:94)

我认为问题在于您的阵列在堆栈中。因为当函数启动时堆栈指针可以是任何东西,所以没有办法对齐数组而不分配比你需要的更多并调整它。如果将数组移出函数并移入全局变量,它应该可以工作。你可以做的另一件事是将它保存为局部变量(这是一件非常好的事情),但要使它成为static。这将防止它存储在堆栈中。请注意,这两种方式都不是线程安全的或递归安全的,因为只有一个数组副本。

使用此代码:

#include <stdio.h>

float a[4] __attribute__((aligned(0x1000))) = {1.0, 2.0, 3.0, 4.0};

int
main(void)
{
        printf("%p %p %p %p\n", &a[0], &a[1], &a[2], &a[3]);
}

我明白了:

0x804c000 0x804c004 0x804c008 0x804c00c

这是预期的。使用原始代码,我只会获得与您相同的随机值。

答案 1 :(得分:40)

gcc中存在一个错误导致属性对齐,无法使用堆栈变量。 它似乎与下面链接的补丁一起修复。下面的链接也包含了很多关于这个问题的讨论。

http://gcc.gnu.org/bugzilla/show_bug.cgi?id=16660

我在上面尝试了两个不同版本的gcc:4.1.2来自RedHat 5.7 框,它失败了类似于你的问题(本地数组在0x1000字节边界上没有任何对齐)。然后我用gcc 4.4.6尝试了你的代码 RedHat 6.3,它运行完美(本地阵列对齐)。神话电视的人有一个类似的问题(上面的gcc补丁似乎修复了):

http://code.mythtv.org/trac/ticket/6535

无论如何,看起来你在gcc中发现了一个错误,在以后的版本中似乎已经修复了。

答案 2 :(得分:13)

最近的GCC(使用4.5.2-8ubuntu4测试)似乎正常工作,阵列对齐正确。

#include <stdio.h>

int main(void)
{
    float a[4] = { 1.0, 2.0, 3.0, 4.0 };
    float b[4] __attribute__((aligned(0x1000))) = { 1.0, 2.0, 3.0, 4.0 };
    float c[4] __attribute__((aligned(0x10000))) = { 1.0, 2.0, 3.0, 4.0 };

    printf("%p %p %p %p\n", &a[0], &a[1], &a[2], &a[3]);
    printf("%p %p %p %p\n", &b[0], &b[1], &b[2], &b[3]);
    printf("%p %p %p %p\n", &c[0], &c[1], &c[2], &c[3]);
}

我明白了:

0x7ffffffefff0 0x7ffffffefff4 0x7ffffffefff8 0x7ffffffefffc
0x7ffffffef000 0x7ffffffef004 0x7ffffffef008 0x7ffffffef00c
0x7ffffffe0000 0x7ffffffe0004 0x7ffffffe0008 0x7ffffffe000c

答案 3 :(得分:9)

Alignement对所有类型都无效。您应该考虑使用结构来查看操作中的属性:

#include <stdio.h>

struct my_float {
        float number;
}  __attribute__((aligned(0x1000)));

struct my_float a[4] = { {1.0}, {2.0}, {3.0}, {4.0} };

int
main(void)
{
        printf("%p %p %p %p\n", &a[0], &a[1], &a[2], &a[3]);
}

然后,你会读到:

0x603000 0x604000 0x605000 0x606000

这是你所期待的。

编辑: 推荐@yzap并关注@Caleb案例评论,最初的问题是由于GCC版本。我已经使用请求者的源代码检查了GCC 3.4.6 vs GCC 4.4.1:

$ ./test_orig-3.4.6
0x7fffe217d200 0x7fffe217d204 0x7fffe217d208 0x7fffe217d20c
$ ./test_orig-4.4.1
0x7fff81db9000 0x7fff81db9004 0x7fff81db9008 0x7fff81db900c

现在很明显,较旧的GCC版本(4.4.1之前的某个地方)显示了对齐病态。

注1:我建议的代码没有回答我理解为“对齐数组的每个字段”的问题。

注2:在main()中使用非静态a []并使用GCC 3.4.6进行编译会破坏struct数组的对齐指令但在结构之间保持0x1000距离...仍然很糟糕! (参见@zifre答案的解决方法)