在大型numpy数组上运行ndnumerate的速度更快

时间:2014-05-26 12:23:46

标签: python loops numpy

嗨我希望加快我的计算速度,使用这个ndnumerate循环非常慢:

下面的循环通过一个numpy数组并在每个单元格上进行一些数学运算但是忽略-9999值,保持它们相同。

my_array = np.array([[-9999, 1, 1],
             [2, 2, -9999],
             [3, 3, 3]])

# Intialise two empty arrays
1_d = np.empty_like(my_array, dtype = float)
3_d = np.empty_like(my_array, dtype = float)

start = time.time()

for [x, y], value in np.ndenumerate(my_array):
     if value >= 0:
         1_d[x, y] = value - (20 * (100 - value)) / ((100 - value) + math.exp(2.533 - 0.0636 * (100 - value)))

         3_d[x, y] = value * math.exp(0.00673 * (100 - value))
    else:
        1_d[x, y] = -9999
        3_d[x, y] = -9999

print "Calculating numbers took " + str(round(time.time() - start,2)) + "s.")

2 个答案:

答案 0 :(得分:3)

你不应该用循环来做这个,而只是使用numpy数组的向量化特性,因为在这种情况下这是完全可能的:

a1_d = my_array - (20 * (100 - my_array)) / ((100 - my_array) + np.exp(2.533 - 0.0636 * (100 - my_array)))
a3_d = my_array * np.exp(0.00673 * (100 - my_array))

要恢复-9999值,您可以执行以下操作:

a1_d[my_array == -9999] = -9999
a3_d[my_array == -9999] = -9999

或其他选项是使用np.nan而不是-9999,这只会传播:

my_array = my_array.astype(float)
my_array[my_array == -9999] = np.nan

或另一种选择是在计算过程中进行布尔索引:

valid = (my_array != -9999)
a1_d[valid] = my_array[valid] * ...
a3_d[~valid] = -9999

对于这个小示例阵列,使用for循环需要大约70μs而不是260μs(使用%%timeit

答案 1 :(得分:0)

您可以使用masked array

import numpy as np

my_array = np.array([[-9999, 1, 1],
             [2, 2, -9999],
             [3, 3, 3]])

value = np.ma.masked_values(my_array, -9999)
d1 = value - (20 * (100 - value)) / ((100 - value) + np.exp(2.533 - 0.0636 * (100 - value)))
d3 = value * np.exp(0.00673 * (100 - value))