复杂函数的向量化

时间:2019-10-25 10:37:30

标签: python numpy vectorization

我正在尝试使用向量化来加速某些for循环。不幸的是,循环内的函数比简单的算术运算要复杂得多。我想获取数组的每个项目,使用具有多个输入的函数对其进行操作,然后将其放置在字典中的正确位置。为此,我有一个名为creation_element的函数:

def increase_element(number, word, factor=0.05):
    print(2.*factor)
    return {'factor': 2.*factor, 'number': number, 'word': word}

我想要实现的是从数组中获取:

array([0., 0.1, 0.2])

到数组:

array([
       {factor: 0., number: 5, word: 'hi'},
       {factor: 0.2, number: 5, word: 'hi'},
       {factor: 0.4, number: 5, word: 'hi'}
      ])

以一种有效的方式(即,不使用for循环),因为实际上函数gain_element需要很长时间才能运行。

我试图做的是使用一个函数将所有输入转换为单个输入,然后将其映射到一个numpy数组上,如下所示:

import numpy as np

muls = np.linspace(0, 1, 11)

def increase_element(number, word, factor=0.05):
    print(2.*factor)
    return {'factor': 2.*factor, 'number': number, 'word': word}

def single_increase_element(inputs):
    return increase_element(inputs[0], inputs[1], factor=inputs[2])

single_array = np.array(list(map(lambda x: (5, 'hi', x), muls)))

np.array(list(map(single_increase_element, single_array)))

但是尝试打印2. * factor时出现以下错误

  

TypeError:无法将序列乘以'float'类型的非整数

任何建议将不胜感激!

1 个答案:

答案 0 :(得分:0)

您打印的因素是<class 'numpy.str_'>类型。 错误是因为您正在尝试使用2.0转换为多个字符串。

对于代码,我建议您解释一下您要实现的目标,因为它很难理解。

编辑:在它下面固定了您的代码。根本原因是dtype = np.object丢失,数字被视为字符串。

import numpy as np

muls = np.linspace(0, 1, 11)

def increase_element(number, word, factor=0.05):
    print(2.*factor)
    return {'factor': 2.*factor, 'number': number, 'word': word}

def single_increase_element(inputs):
    return increase_element(*inputs)  # fixed
    # return increase_element(inputs[0], inputs[1], factor=inputs[2]) # original

# single_array = np.array(list(map(lambda x: (5, 'hi', x), muls)))  # original
single_array = np.array(list(map(lambda x: (5, 'hi', x), muls)), dtype=np.object) # fixed

np.array(list(map(single_increase_element, single_array)))
相关问题