Question

我正在尝试使用向量化来加速某些for循环。不幸的是，循环内的函数比简单的算术运算要复杂得多。我想获取数组的每个项目，使用具有多个输入的函数对其进行操作，然后将其放置在字典中的正确位置。为此，我有一个名为creation_element的函数：

def increase_element(number, word, factor=0.05):
    print(2.*factor)
    return {'factor': 2.*factor, 'number': number, 'word': word}

我想要实现的是从数组中获取：

array([0., 0.1, 0.2])

到数组：

array([
       {factor: 0., number: 5, word: 'hi'},
       {factor: 0.2, number: 5, word: 'hi'},
       {factor: 0.4, number: 5, word: 'hi'}
      ])

以一种有效的方式（即，不使用for循环），因为实际上函数gain_element需要很长时间才能运行。

我试图做的是使用一个函数将所有输入转换为单个输入，然后将其映射到一个numpy数组上，如下所示：

import numpy as np

muls = np.linspace(0, 1, 11)

def increase_element(number, word, factor=0.05):
    print(2.*factor)
    return {'factor': 2.*factor, 'number': number, 'word': word}

def single_increase_element(inputs):
    return increase_element(inputs[0], inputs[1], factor=inputs[2])

single_array = np.array(list(map(lambda x: (5, 'hi', x), muls)))

np.array(list(map(single_increase_element, single_array)))

但是尝试打印2. * factor时出现以下错误

TypeError：无法将序列乘以'float'类型的非整数

任何建议将不胜感激！

Answer 1

您打印的因素是<class 'numpy.str_'>类型。错误是因为您正在尝试使用2.0转换为多个字符串。

对于代码，我建议您解释一下您要实现的目标，因为它很难理解。

编辑：在它下面固定了您的代码。根本原因是dtype = np.object丢失，数字被视为字符串。

import numpy as np

muls = np.linspace(0, 1, 11)

def increase_element(number, word, factor=0.05):
    print(2.*factor)
    return {'factor': 2.*factor, 'number': number, 'word': word}

def single_increase_element(inputs):
    return increase_element(*inputs)  # fixed
    # return increase_element(inputs[0], inputs[1], factor=inputs[2]) # original

# single_array = np.array(list(map(lambda x: (5, 'hi', x), muls)))  # original
single_array = np.array(list(map(lambda x: (5, 'hi', x), muls)), dtype=np.object) # fixed

np.array(list(map(single_increase_element, single_array)))

复杂函数的向量化

1 个答案: