计算平方根和功率的快速方法?

时间:2011-03-17 21:34:46

标签: c# math exponent

C#的Math类只有double和powers。如果我将基于浮点的平方根和幂函数添加到我的Math2类中,那么各种事情可能会更快一些(今天是放松的一天,我发现优化放松)。

所以 - 快速的平方根和电源功能,我不必担心许可,plskthx。或者是一个能让我在那里的链接。

4 个答案:

答案 0 :(得分:9)

我将把它视为公理,没有任何软件方法可以与平方根的硬件指令竞争。唯一的困难是.NET不能像C代码的内联汇编程序那样直接控制硬件。

让我们首先讨论一个通用的x86硬件前景。

浮点x86指令FSQRT确实有三个精度:单,双和扩展(80位FP寄存器的原始精度),单精度和双精度的时序缩短了25-40% 。有关32位x86指令,请参阅 here

这可能听起来像是一个很大的机会,但它只有十几个钟左右。除非您能够仔细管理从函数调用到返回值的代码,否则这种节约将很容易在开销中丢失。托管C ++声音(正如Marcelo Cantos所建议的那样)比C#更加实用。

注意:FSQRT的计时与那些在英特尔架构中共享执行单元的FDIV相同,因此是常见的延迟。

专用C#代码的更好机会可能存在于SSE SIMD指令的方向,其中硬件允许并行完成最多4个单精度平方根。多年来JIT编译器对此的支持一直缺失,但这是目前开发的一些主要内容。

英特尔已经进入(2010年12月15日),看到.NET Framework 4没有对SIMD做任何事情:

[Intel Performance Libraries allow... SIMD instructions in C#]

在此之前,Mono项目在Mono 2.2中添加了对SIMD的JIT支持:

[Mono: Release Note Mono 2.2]

最近在这里提出了从MS C#调用Mono的SIMD支持的可能性:

[Calling mono c# code from Microsoft .net ? -- Stackoverflow]

之前的一个问题也解决了(尽管没有太多的爱!)如何安装Mono的SIMD支持:

[how to enable Mono.Simd -- Stackoverflow]

答案 1 :(得分:6)

应查看此链接:

http://www.codecodex.com/wiki/Calculate_an_integer_square_root

有许多不同语言的快速算法。

例如:

// Finds the integer square root of a positive number  
public static int Isqrt(int num) {  
    if (0 == num) { return 0; }  // Avoid zero divide  
    int n = (num / 2) + 1;       // Initial estimate, never low  
    int n1 = (n + (num / n)) / 2;  
    while (n1 < n) {  
        n = n1;  
        n1 = (n + (num / n)) / 2;  
    } // end while  
    return n;  
} // end Isqrt()  

但还有更多,一些C / C ++应该是最快的,或者他们声称。

对于POW算法检查我找到了这个HERE,并解释了如何从简单的算法开始算法。

private double Power(double a, int b) { 
    if (b<0) { 
        throw new ApplicationException("B must be a positive integer or zero"); 
    } 
    if (b==0) return 1; 
    if (a==0) return 0; 
    if (b%2==0) { 
        return Power(a*a, b/2); 
    } else if (b%2==1) { 
        return a*Power(a*a,b/2); 
    } 
    return 0; 
} 

答案 2 :(得分:1)

维基百科有一篇关于平方根计算的文章: http://en.wikipedia.org/wiki/Methods_of_computing_square_roots

计算x到y的幂更简单: http://www.osix.net/modules/article/?id=696

我喜欢这种笨拙的计算器方式: enter image description here ......但老实说,我不知道它是否很快。

答案 3 :(得分:0)

可能最简单的方法是在Managed C ++中实现float版本。无论是否会比烘焙双版本更快,我不能说。