Question

我读了几个关于未定义行为和序列点的非常好的答案（例如Undefined behavior and sequence points），我理解，

   int i = 1;
   a = i + i++; //this is undefined behaviour

根据C ++标准，

是未定义的代码。但是，未定义的行为背后的深层原因是什么？是否足以使其成为未指明的行为？正常的论点是，通过几个序列点，C ++编译器可以更好地针对不同的体系结构进行优化，但是不会让它未指定允许这些优化吗？在

   a = foo(bar(1), bar(2)); //this is unspecified behaviour

编译器也可以优化，并且它不是未定义的行为。在第一个例子中，似乎很清楚，a是2或3，所以语义似乎对我来说很清楚。我希望有一个推理，为什么有些事情没有说明，有些事情是未定义的。

Answer 1

不所有的优化。例如，Itanium可以并行执行添加和增量，并且可能会因为尝试执行此类操作而出现硬件异常。

但这是一个完全微观的优化，编写编译器来利用这个非常困难，并且它是一个非常罕见的架构，可以做到（当时没有，IIRC，它主要是假想）。所以现实情况是，截至2012年，没有理由不将其定义为明确的行为，事实上，C ++ 11更多地将这些情况定义得很明确。

Answer 2

从C ++的角度来看，我认为答案非常简单：它被定义为未定义的行为，因为C很久以前就已经使它成为未定义的行为，并且基本上没有改变它的潜在收益。

这表明我猜的更多是预期的问题：为什么C会做出这种未定义的行为？

我认为答案并不那么简单。一种可能性是简单的谨慎 - 知道在编写C标准时，C已经在许多机器上实现，部署和使用。当时有相当数量的机器看起来像我仍然看到的很多代码：最初只是作为个人实验设计的东西，运行良好，最终被指定为“生产”，甚至没有通过最令人震惊的问题。因此，即使没有人知道硬件会破坏，也没有人能确定这些硬件也不存在，所以最安全的做法就是把它称为UB，然后用它完成。

另一种可能性是，它有点超出了简单的谨慎。即使我们对现代硬件感觉相当安全，但当时人们真正知道的硬件可能存在重大问题，并且（特别是如果与该硬件相关的供应商在委员会中有代表）允许C运行硬件被认为是重要的。

另一种可能性是，尽管没有人知道（或者甚至担心这种可能性）某些现有的实施可能会破坏，但他们预见到未来可能会破坏某些东西，所以未定义的行为被视为一种方式未来至少在某种程度上证明语言。

最后一种可能性是，无论是谁写出标准的那一部分，只要他们提出似乎可以接受的一套规则，就会转移到其他事情上，即使它们可能已经出现与其他规则至少有些人可能更喜欢。

如果我不得不猜测，我会说这可能是我给出的第三种和第四种可能性的组合 - 委员会意识到并行计算的发展而不知道它最终会如何发挥作用，所以对于那些写这篇文章的人来说，最大限度地利用实现方面的宽容似乎是获得共识的最简单/最简单的途径，这样他们就可以完成它并转向更大更好的东西。

Answer 3

未定义的行为与未指定的行为之间存在巨大差异。未指定的行为是格式良好的（即合法的），但标准使编译器供应商在实现方面有一定的自由度。未定义的行为是一种似乎在语法上正确的暴行。认为行为“未定义”而不是违规行为（编译器必须拒绝）的主要原因是，有时未定义的行为可能很难诊断。

Answer 4

a = foo(bar(1), bar(2)); // this is unspecified behaviour

两个函数调用可以按任何顺序进行，但它们仍然是两个不同的函数调用。即使内联呼叫，也不允许机器指令重叠。实际上，它们确实重叠了很多，但优化器被限制为生成严格的代码 - 如果函数调用是分开的。

a = i + i++; // this is undefined behaviour

使用标量i，不需要分离：从i获取的cpu指令，添加和后增量，自由混合，并允许优化器假装它不知道我在左边我在右边是一样的。当违反这个先决条件时，无法确定它会产生什么样的破坏组件。因此，未定义。

Answer 5

MIPS 1是带有Load Delay插槽的合理实现。执行加载不是即时的。结果仅在下一条指令开始后可见。对于编译器来说，这没什么大不了的。只需在下一个插槽中放入一条不相关的指令。

当然，编译器必须知道“无关”是什么。使用针对单个varibale的并发修改的C规则，编译器在查找必须不相关的指令时有更多的选择。如果在一个语句中出现两个操作，则它们必须对不同的变量进行操作，因此不相关。

为什么a = i + i ++未定义且未指定行为

5 个答案: