performance - 核心2 x87浮点性能

我正在使用一些数字运算代码，就其本质而言，它是浮点密集型而且速度很慢。它是研究代码，因此可以针对一个架构进行定制，并且在Core 2 Quad盒上运行。我的理解是，对于奔腾4 / Netburst架构，英特尔严厉剥离了x87 FPU，并采用了更加以SSE2为中心的设计。这导致了x87代码的糟糕表现。但是，Core 2架构与P6架构的关系比Netburst更紧密。

我的编译器并不针对所有AFAIK的SSE，我的理解是很少有编译器能做到这一点。此外，我正在使用D语言，这是相当前沿的，所以没有很多编译器可用。但是，我不想切换语言，因为我现有代码的惯性，并且因为尽管它不成熟，但我真的很喜欢D。

Core 2架构是否还有一个简化的x87 FPU？如果是这样，最好的方法是什么？

核心2 x87浮点性能

1 个答案: