为什么numba在这个简单的总和上要快得多?

时间:2016-04-13 06:10:47

标签: python numpy cython numba f2py

我有一个公共笔记本,其中python,numpy,numba,cython和fortran通过简单求和进行比较:

https://gist.github.com/denfromufa/7727874c4fe1e7e174ed953930e93bbc

为什么numba这么快?

1 个答案:

答案 0 :(得分:3)

正如@DavidW指出的那样,你并没有真正对相同算法进行比较。下面我为每个cython和numba编写了两个单独的函数来执行相同的操作。第一个是在数组上运行,第二个是给定一个整数:

用Cython:

cpdef long cy_sum(long[:] A):
    cdef long i, n = A.shape[0], s = 0
    for i in range(n):
        s += A[i]
    return s

cpdef long cy_sum2(long i):
    cdef long s, x
    s = 0
    for x in range(i):
        s += x
    return s

Numba:

@nb.jit(nopython=True)
def nb_sum(A):
    s=0
    n = A.shape[0]
    for i in range(n):
        s += A[i]
    return s

@nb.jit(nopython=True)
def nb_sum2(i):
    s=0
    for x in range(i):
        s+=x
    return s

测试以确保它们给出相同的结果:

N = int(1e6)
d = np.arange(N, dtype=np.int64)

print np.allclose(nb_sum(d), cy_sum(d))   # True
print np.allclose(nb_sum2(N), cy_sum2(N))  # True

我硬件上的时间安排:

%timeit cy_sum(d)
%timeit nb_sum(d)

1000 loops, best of 3: 416 µs per loop
1000 loops, best of 3: 237 µs per loop

%timeit cy_sum2(N)
%timeit nb_sum2(N)

10000000 loops, best of 3: 63.5 ns per loop
10000000 loops, best of 3: 187 ns per loop

我不会从这样的微基准中得出太多结论,但至少现在正在比较等效的实现。