Question

在他的书The C++ Standard Library (Second Edition)中，Nicolai Josuttis指出，编译器可以比普通函数更好地优化lambdas。

此外，C ++编译器比它们更好地优化lambdas 普通功能。（第213页）

为什么？

我认为在内联时不应该有任何区别。我能想到的唯一原因是编译器可能有一个更好的本地上下文与lambdas，这样可以做出更多假设并执行更多优化。

Answer 1

原因是lambda是函数对象，因此将它们传递给函数模板将实例化一个专门用于该对象的新函数。因此编译器可以简单地内联lambda调用。

另一方面，对于函数，旧的警告适用：函数指针被传递给函数模板，并且编译器传统上在通过函数指针调用调用方面存在很多问题。理论上它们可以内联，但前提是内联函数也是内联的。

例如，请考虑以下函数模板：

template <typename Iter, typename F>
void map(Iter begin, Iter end, F f) {
    for (; begin != end; ++begin)
        *begin = f(*begin);
}

用这样的lambda调用它：

int a[] = { 1, 2, 3, 4 };
map(begin(a), end(a), [](int n) { return n * 2; });

此实例化中的结果（由编译器创建）：

template <>
void map<int*, _some_lambda_type>(int* begin, int* end, _some_lambda_type f) {
    for (; begin != end; ++begin)
        *begin = f.operator()(*begin);
}

...编译器知道_some_lambda_type::operator ()并且可以简单地内联调用它。（并且使用任何其他lambda调用函数map将创建map的新实例化，因为每个lambda具有不同的类型。）

但是当使用函数指针调用时，实例化如下所示：

template <>
void map<int*, int (*)(int)>(int* begin, int* end, int (*f)(int)) {
    for (; begin != end; ++begin)
        *begin = f(*begin);
}

...此处f指向每个map调用的不同地址，因此编译器无法内联对f的调用，除非对map的周围调用也有内联，以便编译器可以将f解析为一个特定的函数。

Answer 2

因为当你将“函数”传递给算法时，你实际上是在传递一个指向函数的指针，所以它必须通过指向函数的指针进行间接调用。当您使用lambda时，您将对象传递给专门为该类型实例化的模板实例，并且对lambda函数的调用是直接调用，而不是通过函数指针调用，因此更可能内联。

Answer 3

Lambda 不会比通常的函数更快或更慢。如有错误请指正。

首先，lambda 和普通函数有什么区别：

Lambda 可以捕获。
极有可能的 Lambda 在从目标文件编译期间可以简单地移除，因为它具有内部链接。

让我们谈谈捕获。它不会为函数提供任何性能，因为编译器必须传递带有处理捕获所需的数据的附加对象。无论如何，如果您只是在适当的位置使用 lambda 函数，它将很容易优化。此外，如果 lambda 不使用捕获，您可以将 lambda 转换为函数指针。为什么？因为如果没有捕获就只是一个普通的函数。

void (*a1)() = []() {
    // ...
};
void _tmp() {
    // ...
}
void (*a2)() = _tmp;

以上两个例子都是有效的。

说到从目标文件中删除函数。您可以简单地将您的函数放入匿名命名空间，它就会达成交易。函数内联会更开心一点，因为它不会在除了文件之外的任何地方使用。

auto a1 = []() {
    // ...
};

namespace {
    auto a2() {
        // ...
    }
}

上述功能将与性能相同。

我还注意到函数指针和 lambdas 进行了比较。这不是一件好事，因为它们是不同的。当你有一个指向函数的指针时，它可以指向各种不同的函数，并且可以在运行时改变，因为它只是一个指向内存的指针。 Lambda 不能这样做。它总是只用一个函数运行，因为调用哪个函数的信息存储在类型本身中。

你可以用这样的函数指针编写代码：

void f1() {
    // ...
}
void f2() {
    // ...
}
int main() {
    void (*a)();
    a = f1;
    a = f2;
}

完全没问题。并且您不能以这种方式使用 lambda 编写代码：

int main() {
    auto f1 = []() {
        // ...
    };
    auto f2 = []() {
        // ...
    };
    f2 = f1; // error: no viable overloaded '='
}

如果某些库接受函数指针，并不意味着编译器可以比普通函数更好地优化 lambda，因为问题不在于公共库和函数指针。

为什么lambdas可以通过编译器比普通函数更好地优化？

3 个答案: