如何用多态实现数据局部性?

时间:2014-11-06 09:23:24

标签: c++ caching polymorphism

(标题可能“不那么理想”。)

假设有这样的代码:

class Foo {/*stuff*/};
class Bar1 : Foo {/*stuff*/};
class Bar2 : Foo {/*stuff*/};

std::vector<Foo*> foos;

// Populate 'foos' with Foo, Bar1 and Bar2 objects

// Iterate through foos
for(Foo* foo : foos) foo->doSomething();

基本上,foos是一个带有Foo个对象指针的向量。但是,循环遍历此向量可能会导致缓存未命中。理论上的补救方法是存储实际的对象而不是指针,但这在C ++中是不允许的(没有数组的多态性)。

那说:当需要大量的多态对象时,如何改善数据局部性(并最大限度地减少缓存未命中)?

我对此感兴趣,因为每个人都告诉我缓存命中/未命中在性能关键型软件中非常重要,因此应避免使用上面给出的代码示例中的指针。但是,这实际上意味着抛弃多态性。

1 个答案:

答案 0 :(得分:1)

我认为通常情况是你必须牺牲性能才能使用多态,但在这种情况下,你可以维护Bar1Bar2的单独向量。您可以将这些视为Bar1Bar2的“池”。

然后填充Foo对象指针的向量,并指向Bar1Bar2池中对象的指针:

template<typename Bar>
void populateFoos(std::vector<Foo*>& foos, std::vector<Bar>& bars) {
    for (auto& bar : bars)
        foos.emplace_back(&bar);
}

std::vector<Bar1> bar1s;
std::vector<Bar2> bar2s;

std::vector<Foo*> foos;

// Populate Bar1s
bar1s.emplace_back();
bar1s.emplace_back();

// Populate Bar2s
bar2s.emplace_back();

// Populate 'foos' with Bar1 and Bar2 objects
populateFoos(foos, bar1s);
populateFoos(foos, bar2s);

// Iterate through foos
for(auto foo : foos) 
    foo->doSomething(); 

Live demo

您需要注意不要通过重新分配FooBar1池来使Bar2对象指针无效。