索引具有2个索引列表的2D Numpy数组

时间:2016-02-24 16:35:28

标签: python arrays numpy

我有一个奇怪的情况。

我有一个2D Numpy数组,x:

x = np.random.random_integers(0,5,(20,8))

我有2个索引器 - 一个带有行的索引,另一个带有索引。为了索引X,我必须执行以下操作:

row_indices = [4,2,18,16,7,19,4]
col_indices = [1,2]
x_rows = x[row_indices,:]
x_indexed = x_rows[:,column_indices]

而不仅仅是:

x_new = x[row_indices,column_indices]

(失败了:错误,不能用(2,)广播(20,))

我希望能够使用广播在一行中进行索引,因为这样可以保持代码的清晰和可读性......而且,我不知道所有关于python的内容,但是据我所知,它应该更快一行(我将使用相当大的数组)。

测试用例:

x = np.random.random_integers(0,5,(20,8))

row_indices = [4,2,18,16,7,19,4]
col_indices = [1,2]
x_rows = x[row_indices,:]
x_indexed = x_rows[:,col_indices]

x_doesnt_work = x[row_indices,col_indices]

5 个答案:

答案 0 :(得分:18)

使用索引或布尔数组/掩码

np.ix_的选择或赋值

1。使用indexing-arrays

:一种。选择

我们可以使用np.ix_来获取可以相互广播的索引数组的元组,从而产生更高维度的索引组合。因此,当该元组用于索引到输入数组时,会给我们相同的高维数组。因此,要根据两个1D索引数组进行选择,它将是 -

x_indexed = x[np.ix_(row_indices,col_indices)]

<强> B中。分配

我们可以使用相同的表示法将标量或可广播数组分配到这些索引位置。因此,以下适用于作业 -

x[np.ix_(row_indices,col_indices)] = # scalar or broadcastable array

2。使用masks

我们也可以使用np.ix_的布尔数组/掩码,类似于索引数组的使用方式。这可以再次用于从输入数组中选择一个块,也可以用于分配它。

:一种。选择

因此,row_maskcol_mask布尔数组分别作为行和列选择的掩码,我们可以使用以下选项 -

x[np.ix_(row_mask,col_mask)]

<强> B中。分配

以下适用于作业 -

x[np.ix_(row_mask,col_mask)] = # scalar or broadcastable array

样本运行

<强> 1。将np.ix_indexing-arrays

一起使用

输入数组和索引数组 -

In [221]: x
Out[221]: 
array([[17, 39, 88, 14, 73, 58, 17, 78],
       [88, 92, 46, 67, 44, 81, 17, 67],
       [31, 70, 47, 90, 52, 15, 24, 22],
       [19, 59, 98, 19, 52, 95, 88, 65],
       [85, 76, 56, 72, 43, 79, 53, 37],
       [74, 46, 95, 27, 81, 97, 93, 69],
       [49, 46, 12, 83, 15, 63, 20, 79]])

In [222]: row_indices
Out[222]: [4, 2, 5, 4, 1]

In [223]: col_indices
Out[223]: [1, 2]

使用np.ix_ -

索引数组的元组
In [224]: np.ix_(row_indices,col_indices) # Broadcasting of indices
Out[224]: 
(array([[4],
        [2],
        [5],
        [4],
        [1]]), array([[1, 2]]))

选择 -

In [225]: x[np.ix_(row_indices,col_indices)]
Out[225]: 
array([[76, 56],
       [70, 47],
       [46, 95],
       [76, 56],
       [92, 46]])

作为suggested by OP,这实际上与执行 old-school 广播相同,其中2D阵列版本为row_indices,其元素/索引已发送< / em>到axis=0,从而在axis=1创建单身维度,从而允许使用col_indices进行广播。因此,我们会有一个像这样的替代解决方案 -

In [227]: x[np.asarray(row_indices)[:,None],col_indices]
Out[227]: 
array([[76, 56],
       [70, 47],
       [46, 95],
       [76, 56],
       [92, 46]])

如前所述,对于作业,我们只是这样做。

Row,col索引数组 -

In [36]: row_indices = [1, 4]

In [37]: col_indices = [1, 3]

使用标量进行分配 -

In [38]: x[np.ix_(row_indices,col_indices)] = -1

In [39]: x
Out[39]: 
array([[17, 39, 88, 14, 73, 58, 17, 78],
       [88, -1, 46, -1, 44, 81, 17, 67],
       [31, 70, 47, 90, 52, 15, 24, 22],
       [19, 59, 98, 19, 52, 95, 88, 65],
       [85, -1, 56, -1, 43, 79, 53, 37],
       [74, 46, 95, 27, 81, 97, 93, 69],
       [49, 46, 12, 83, 15, 63, 20, 79]])

使用2D块(可广播数组)进行分配 -

In [40]: rand_arr = -np.arange(4).reshape(2,2)

In [41]: x[np.ix_(row_indices,col_indices)] = rand_arr

In [42]: x
Out[42]: 
array([[17, 39, 88, 14, 73, 58, 17, 78],
       [88,  0, 46, -1, 44, 81, 17, 67],
       [31, 70, 47, 90, 52, 15, 24, 22],
       [19, 59, 98, 19, 52, 95, 88, 65],
       [85, -2, 56, -3, 43, 79, 53, 37],
       [74, 46, 95, 27, 81, 97, 93, 69],
       [49, 46, 12, 83, 15, 63, 20, 79]])

<强> 2。将np.ix_masks

一起使用

输入数组 -

In [19]: x
Out[19]: 
array([[17, 39, 88, 14, 73, 58, 17, 78],
       [88, 92, 46, 67, 44, 81, 17, 67],
       [31, 70, 47, 90, 52, 15, 24, 22],
       [19, 59, 98, 19, 52, 95, 88, 65],
       [85, 76, 56, 72, 43, 79, 53, 37],
       [74, 46, 95, 27, 81, 97, 93, 69],
       [49, 46, 12, 83, 15, 63, 20, 79]])

输入行,col蒙版 -

In [20]: row_mask = np.array([0,1,1,0,0,1,0],dtype=bool)

In [21]: col_mask = np.array([1,0,1,0,1,1,0,0],dtype=bool)

选择 -

In [22]: x[np.ix_(row_mask,col_mask)]
Out[22]: 
array([[88, 46, 44, 81],
       [31, 47, 52, 15],
       [74, 95, 81, 97]])

使用标量进行分配 -

In [23]: x[np.ix_(row_mask,col_mask)] = -1

In [24]: x
Out[24]: 
array([[17, 39, 88, 14, 73, 58, 17, 78],
       [-1, 92, -1, 67, -1, -1, 17, 67],
       [-1, 70, -1, 90, -1, -1, 24, 22],
       [19, 59, 98, 19, 52, 95, 88, 65],
       [85, 76, 56, 72, 43, 79, 53, 37],
       [-1, 46, -1, 27, -1, -1, 93, 69],
       [49, 46, 12, 83, 15, 63, 20, 79]])

使用2D块(可广播数组)进行分配 -

In [25]: rand_arr = -np.arange(12).reshape(3,4)

In [26]: x[np.ix_(row_mask,col_mask)] = rand_arr

In [27]: x
Out[27]: 
array([[ 17,  39,  88,  14,  73,  58,  17,  78],
       [  0,  92,  -1,  67,  -2,  -3,  17,  67],
       [ -4,  70,  -5,  90,  -6,  -7,  24,  22],
       [ 19,  59,  98,  19,  52,  95,  88,  65],
       [ 85,  76,  56,  72,  43,  79,  53,  37],
       [ -8,  46,  -9,  27, -10, -11,  93,  69],
       [ 49,  46,  12,  83,  15,  63,  20,  79]])

答案 1 :(得分:6)

怎么样:

x[row_indices][:,col_indices]

例如,

x = np.random.random_integers(0,5,(5,5))
## array([[4, 3, 2, 5, 0],
##        [0, 3, 1, 4, 2],
##        [4, 2, 0, 0, 3],
##        [4, 5, 5, 5, 0],
##        [1, 1, 5, 0, 2]])

row_indices = [4,2]
col_indices = [1,2]
x[row_indices][:,col_indices]
## array([[1, 5],
##        [2, 0]])

答案 2 :(得分:3)

$('#modal').dialog("option", "buttons", {
    Save: SaveMethod,
    Cancel: function() {
        $(this).dialog("close");
    }
});

var saving = false;

function SaveMethod(){
  if(saving) return;
  saving = true;
  //save code
  saving = false;
}

请注意,numpy具有非常不同的规则,具体取决于您使用的索引类型。所以索引几个元素应该是import numpy as np x = np.random.random_integers(0,5,(4,4)) x array([[5, 3, 3, 2], [4, 3, 0, 0], [1, 4, 5, 3], [0, 4, 3, 4]]) # This indexes the elements 1,1 and 2,2 and 3,3 indexes = (np.array([1,2,3]),np.array([1,2,3])) x[indexes] # returns array([3, 5, 4]) 的{​​{1}}(参见indexing manual)。

因此,您只需将tuple转换为np.ndarray即可按预期方式工作。

答案 3 :(得分:3)

我认为您正在尝试执行以下(equlvalent)操作之一:

x_does_work = x[row_indices,:][:,col_indices]
x_does_work = x[:,col_indices][row_indices,:]

这实际上会创建x的子集,只包含选定的行,然后从中选择列,反之亦然。第一种情况可以被认为是

x_does_work = (x[row_indices,:])[:,col_indices]

答案 4 :(得分:2)

如果你用 np.newaxis 编写它,你的第一次尝试会成功

x_new = x[row_indices[:, np.newaxis],column_indices]