通过没有循环的2D索引数组索引2D numpy数组

时间:2013-11-20 18:17:38

标签: python arrays numpy

我正在寻找一种矢量化的方法来索引numpy.arraynumpy.array个索引。

例如:

import numpy as np

a = np.array([[0,3,4],
              [5,6,0],
              [0,1,9]])

inds = np.array([[0,1],
                 [1,2],
                 [0,2]])

我想构建一个新数组,这样该数组中的每一行(i)都是数组a的一行(i),由数组inds(i)的行索引。我想要的输出是:

array([[ 0.,  3.],   # a[0][:,[0,1]]
       [ 6.,  0.],   # a[1][:,[1,2]] 
       [ 0.,  9.]])  # a[2][:,[0,2]]

我可以用循环实现这个目的:

def loop_way(my_array, my_indices):
    new_array = np.empty(my_indices.shape)
    for i in xrange(len(my_indices)):
        new_array[i, :] = my_array[i][:, my_indices[i]]
    return new_array 

但我正在寻找一种纯粹的矢量化解决方案。

2 个答案:

答案 0 :(得分:7)

使用索引数组索引另一个数组时,每个索引数组的形状应与输出数组的形状相匹配。您希望列索引与inds匹配,并且您希望行索引与输出的行匹配,如:

array([[0, 0],
       [1, 1],
       [2, 2]])

由于广播,您只能使用上面的一列,因此您可以使用np.arange(3)[:,None]是垂直arange,因为None会插入一个新轴:

>>> np.arange(3)[:, None]
array([[0],
       [1],
       [2]])

最后,在一起:

>>> a[np.arange(3)[:,None], inds]
array([[0, 3],   # a[0,[0,1]]
       [6, 0],   # a[1,[1,2]] 
       [0, 9]])  # a[2,[0,2]]

答案 1 :(得分:2)

虽然有点不明显,但可能如下:

>>> a[np.arange(a.shape[0])[:, None], inds]
array([[0, 3],
       [6, 0],
       [0, 9]])

索引np.arange(a.shape[0])只是索引列索引inds数组所适用的行。附加[:, None]修改此数组的形状,使其形状为(a.shape[0], 1),即每个行索引位于1列宽的2D数组的单独行中。

基本原则是索引数组中的维度数必须一致,并且它们的形状也必须这样。请参阅np.ix_的文档以了解这一点。