如何在一维数组上矢量化操作以生成numpy中的二维矩阵

时间:2013-01-08 14:31:45

标签: numpy vectorization

我有一个值的数组

i = np.arange(0,7,1)

和一个功能

# Returns a column matrix
def fn(i):
    return np.matrix([[i*2,i*3]]).T


fnv = np.vectorize(fn) 

然后写

fnv(i)

给我一​​个错误

  File "<stdin>", line 1, in <module>
  File "c:\Python33\lib\site-packages\numpy\lib\function_base.py", 
        line 1872, in __call__
    return self._vectorize_call(func=func, args=vargs)
  File "c:\Python33\lib\site-packages\numpy\lib\function_base.py", 
        line 1942, in _vectorize_call
        copy=False, subok=True, dtype=otypes[0])
  ValueError: setting an array element with a sequence.

我正在寻找的结果是一个矩阵,它有两行,列数和输入数组一样多。 numpy中实现这一目标的最佳符号是什么?

例如 i 等于

[1,2,3,4,5,6]

,输出等于

[[2,4,6,8,10,12],
 [3,6,9,12,15,18]]

2 个答案:

答案 0 :(得分:5)

修改 你应该尽量避免使用vectorize,因为它给出了numpy效率的错觉,但在它内部是所有的python循环。

如果你真的需要处理用户提供的int s并返回matrix形状(2, 1)的函数,那么你可能做的事情就不多了。但这似乎是一个非常奇怪的用例。如果您可以使用int并返回int的函数列表替换它,并在需要时使用ufuncs,即np.sin而不是math.sin },您可以执行以下操作

def vectorize2(funcs) :
    def fnv(arr) :
        return np.vstack([f(arr) for f in funcs])
    return fnv

f2 = vectorize2((lambda x : 2 * x, lambda x : 3 * x))

>>> f2(np.arange(10))
array([[ 0,  2,  4,  6,  8, 10, 12, 14, 16, 18],
       [ 0,  3,  6,  9, 12, 15, 18, 21, 24, 27]])

仅供您参考,我已经将这个矢量化时间与你提议的那个相对应:

f = vectorize(fn)


>>> timeit.timeit('f(np.arange(10))', 'from __main__ import np, f', number=1000)
0.28073329263679625
>>> timeit.timeit('f2(np.arange(10))', 'from __main__ import np, f2', number=1000)
0.023139129945661807


>>> timeit.timeit('f(np.arange(10000))', 'from __main__ import np, f', number=10)
2.3620706288432984
>>> timeit.timeit('f2(np.arange(10000))', 'from __main__ import np, f2', number=10)
0.002757072593169596

因此,即使对于小型阵列,速度也有一个数量级,对于较大的阵列,它几乎可以免费增加到x1000的速度。

原始回答

除非没有办法,否则不要使用vectorize,这很慢。请参阅以下示例

>>> a = np.array(range(7))
>>> a
array([0, 1, 2, 3, 4, 5, 6])
>>> np.vstack((a, a+1))
array([[0, 1, 2, 3, 4, 5, 6],
       [1, 2, 3, 4, 5, 6, 7]])
>>> np.vstack((a, a**2))
array([[ 0,  1,  2,  3,  4,  5,  6],
       [ 0,  1,  4,  9, 16, 25, 36]])

无论你的功能是什么,如果它可以用numpy的ufunc构建,你可以做np.vstack((a, f(a)))之类的事情并获得你想要的东西

答案 1 :(得分:0)

vectorize的简单重新实现为我提供了我想要的东西

def vectorize( fn):
    def do_it (array):
        return np.column_stack((fn(p) for p in array))
    return do_it

如果这不符合要求或有更好的方法,请告诉我。