numpy数组操作的奇怪行为

时间:2013-12-04 14:26:44

标签: python arrays numpy

解释一下:

>>> a = np.arange(10)
>>> a[2:]
array([2, 3, 4, 5, 6, 7, 8, 9])
>>> a[:-2]
array([0, 1, 2, 3, 4, 5, 6, 7])
>>> a[2:] - a[:-2]
array([2, 2, 2, 2, 2, 2, 2, 2])
>>> a[2:] -= a[:-2]
>>> a
array([0, 1, 2, 2, 2, 3, 4, 4, 4, 5])

预期结果当然是array([0, 1, 2, 2, 2, 2, 2, 2, 2, 2])

我会猜测这与numpy并行化的事情有关,并且不够聪明,以至于需要首先制作数据的临时副本(或以正确的顺序执行操作)。 / p>

换句话说,我怀疑它正在做一些像这样天真的事情:

for i in range(2, len-2):
    a[i] -= a[i-2]

供参考,它适用于Matlab和Octave:

a = 0:9
a(3:end) = a(3:end) - a(1:end-2)

a =

  0  1  2  3  4  5  6  7  8  9

a =

  0  1  2  2  2  2  2  2  2  2

如果你这样做,实际上它可以正常工作:

a[2:] = a[2:] - a[:-2]

所以这可能意味着a -= b与numpy的a = a - b不同!

实际上现在我开始考虑它,我认为Mathworks将此作为未实现+ =, - =,/ =和* =运算符的原因之一!

2 个答案:

答案 0 :(得分:4)

当您按照示例中的方式切片numpy数组时,您将获得数据的视图而不是副本。

请参阅:

http://scipy-lectures.github.io/advanced/advanced_numpy/#example-inplace-operations-caveat-emptor

答案 1 :(得分:1)

意外的行为是由数组aliasing引起的,因为(正如@JoshAdel在他的回答中所述),切片返回一个视图,而不是数组的副本。你的“天真”循环的例子已经解释了如何计算结果。但我会在你的解释中加上两点:

首先,意外行为不是由于numpy并行化操作造成的。如果操作是并行化的,那么你不应该期望[始终]看到天真循环的结果(因为该结果取决于循环的有序执行)。如果您多次重复实验 - 即使对于大型阵列 - 您也应该看到相同的结果。

其次,虽然你的推定一般都是正确的,但我会这样说:

a -= b a = a - b 时,

a与两个numpy数组b相同没有别名