Question

我对汇编程序中的指针有很大的误解。我知道要获取指针（变量）的地址，请使用

MOV EAX, variable
or 
LEA EAX, variable

我也知道MOV有很多不同的OP代码，但我感兴趣的是MOV register, address。

问题是......它如何知道变量所在的地址？汇编程序是否已在可执行文件中生成MOV EAX, address_of_variable或指令为MOV EAX, ...并且它找到该值然后获取它的地址。但是它如何知道如何在内存中搜索该值然后返回地址（假设每次都改变地址）。

如果这是一个愚蠢的问题，请原谅我，但我不明白它是如何做到的。

Answer 1

在标准体系结构上，您可以存储变量的各种位置：

数据段/ BSS：对于全局变量和静态局部变量（具有静态存储持续时间的变量）;
Stack：局部变量（具有自动存储持续时间的变量）;
堆：动态变量（具有动态存储持续时间的变量，使用new或malloc分配 - 类似函数）。

编译器如何解析变量的地址取决于存储变量的位置。

数据段/ BSS

这些是具有静态存储持续时间的变量，编译器在编译时知道它们的所有内容，并且它们的地址在链接时已知。请看以下代码段：

int a = 0;

int main () {
    return a;   
}

汇编（缩减）：

a:
        .zero   4
main:
        ...
        movl    a(%rip), %eax
        ...

您有a所在的数据段（程序集顶部），要获取a的地址，编译器将使用a(%rip)（指定x86程序集）。这将被取代＆＃34;在链接时由链接器 - 没有＆＃34;动态＆＃34;计算地址。

注意：否＆＃34;动态＆＃34;计算意味着在运行时没有用于计算地址的指令，但这些地址＆＃34; live＆＃34;在virtual address space（相对于程序本身），并将在memory management unit的运行时转换为物理地址。

堆

这可能是最简单的存储类型：变量的地址已存储在某处，因此您只需检索它。请看以下代码段：

int main () {
    int *p = new int();
    return *p;      
}

大会：

main:
        ...
        movq    -8(%rbp), %rax # Load p into rax (see the stack section)
        movl    (%rax), %eax   # Load *p into eax
        ...

有关第一个汇编指令的说明，请参阅堆栈部分，但基本上它将p的值存储到rax寄存器中，然后使用(%rax)来检索值存储在rax的地址中（如果rax包含0x8000，则(%rax)是地址0x8000处的值）。

堆栈

具有自动存储持续时间的变量存储在堆栈中，并且它们的地址相对于堆栈指针（这是一个始终指向堆栈的＆＃34; base＆＃34;的寄存器）进行检索。请看以下代码段：

int f() {
    int a = 4;
    return a + 2;
}

汇编（缩减）：

f():
        ...
        movl    $4, -4(%rbp)     # Set a = 4
        movl    -4(%rbp), %eax   # Load a into eax
        addl    $2, %eax         # Add 2 to eax
        ...

在上面的程序集中，rbp是基本指针，正如您所看到的，a的地址是-4(%rbp)相对于它检索的（第一条指令基本上是a = 4）。

注意：返回值存储在eax寄存器中，如果存在，该函数的参数也将放在堆栈中，但此行为取决于{ {3}}，其他架构可能使用不同的方法。

汇编程序指针地址 - 如何获取它

1 个答案:

数据段/ BSS

堆

堆栈