表示连接切片的切片

时间:2015-12-21 12:10:15

标签: python numpy slice

在考虑基础维度时,切片slice(start, stop[, step])的索引通常可由range(start, stop, step)(或range(*slice(start, stop, step).indices(length))表示。)

假设我有两个多维切片,第二个切片可以用作应用第一个切片的结果的切片。

示例:

import numpy as np
data = np.random.rand(*(100, 100, 100))
a = data[::2, 7, :] # slice 1, a.shape = (50,100)
b = a[1, ::-1] # slice 2, b.shape = (100,)

我想找到一个用于计算执行相同工作的单个切片的通用表达式。我知道底层数据结构的维度。

c = data[2, 7, ::-1] # same as b
np.array_equal(b, c) # True

因此,在此示例中,从[::2, 7, :][1, ::-1][2, 7, ::-1],我需要一个类似的函数:

def concatenate_slices(shape, outer_slice, inner_slice):
    ...
    return combined_slice

其中outer_sliceinner_slice都是切片的元组。在示例中shape=(100, 100, 100)outer_slice=(slice(None, None, 2), 7, slice(None, None, None))以及inner_slice=(1, slice(None, None, -1))

我不确定如何有效地做到这一点。

我的对象在调用__getitem__(slice)时执行某些操作(没有中间视图),我只想做一次,但仍然可以切片。

作为扩展(可选)我想知道如果切片中有椭圆会发生什么。我怎么才能组合呢?

2 个答案:

答案 0 :(得分:1)

让我们从简单的案例开始:1-d数组。我们需要跟踪最终切片的startstopstep值,我们可以像这样更新:

def update_1d(a, b, length):
  a_start, a_stop, a_step = a.indices(length)
  a_length = len(xrange(a_start, a_stop, a_step))
  if a_length == 0:
    # doesn't matter what b is if data[a] is []
    return a
  b_start, b_stop, b_step = b.indices(a_length)
  b_length = len(xrange(b_start, b_stop, b_step))
  if b_length == 0:
    # result will be empty, so we can exit early
    return slice(0, 0, 1)
  # convert b's start into a's coordinates, without wrapping around
  start = max(0, a_start + b_start * a_step)
  # steps are multiplicative, which makes things easy
  step = a_step * b_step
  # the stop index is the hard part because it depends on the sign of both steps
  x = a_start + b_stop * a_step
  if step < 0:
    # indexing backwards, so truncate if b's converted step goes below zero
    stop = x if x >= 0 else None
  elif a_step > 0:
    # both steps are positive, so take the smallest stop index
    stop = min(a_stop, x)
  else:
    # both steps are negative, so take the largest stop index
    stop = max(a_stop, x)
  return slice(start, stop, step)

请注意,这需要ab作为切片。但是,您通常可以将其他表单转换为切片对象。这甚至包括Ellipsis个对象,假设您知道有多少维度。

为了将其扩展到多维案例,我们需要做一些簿记来跟踪哪些原始维度被切片。例如,如果您有data[::2, 7, :][:, 2:-2],则必须将第二个切片的第二个维度映射到第一个切片的第三个维度。

答案 1 :(得分:1)

我怀疑你只需要经历分析每个维度的乏味,建立新的切片或索引数组。我怀疑是否有捷径。

举例说明:

In [77]: shape=(100,100,100)
In [78]: outer_slice=(slice(None, None, 2), 7, slice(None, None, None))
In [79]: inner_slice=(1, slice(None, None, -1))

目标是(对吗?):

(2, 7, slice(None,None,-1))

第一维 - 制作整个索引范围的数组,并按顺序切片:

In [80]: idx=np.arange(shape[0])
In [81]: idx[outer_slice[0]][inner_slice[0]]
Out[81]: 2

我可以从[:: 2]和[1]中推断出来吗?我必须推断它从0开始,形状足够大以产生第二个值等等

现在是第二个维度。这是一个标量,因此没有相应的inner切片。

In [82]: outer_slice[1]
Out[82]: 7

对于第三个,让我们做与第一个相同,但考虑外部和内部列表之间的偏移:

In [83]: idx=np.arange(shape[2])
In [84]: idx[outer_slice[2]][inner_slice[1]]
Out[84]: 
array([99, 98, 97, 96, 95, 94, 93, 92, 91,  ....7,  6,  5,  4,  3,  2,  1,  0])

或者我可以推断outer_slice[2]什么都不做,所以我可以直接使用inner_slice[1]

当然,将两个切片元组应用于实际数组同样简单有效。

X[outer_slice][inner_slice]

只要outer_slice生成一个视图,将它们组合成一个复合切片就不会有太大的改进。

对于形状和切片元组,有足够的信息来构建新的元组。但似乎所需的逻辑将非常复杂,需要深入了解切片和大量测试。