从列表创建结构化数组

时间:2017-04-24 09:16:23

标签: python numpy structured-array

我有一个简单的元素列表,我试图用它来制作structured array

这种天真的方法失败了:

y = np.array([1,2,3], dtype=[('y', float)])
TypeError: expected an object with a buffer interface

将每个元素放在一个元组中起作用:

# Manuel way
y = np.array([(1,), (2,), (3,)], dtype=[('y', float)])
# Comprehension
y = np.array([tuple((x,)) for x in [1,2,3]], dtype=[('y', float)])

如果我先从列表中创建一个数组,它也可以工作:

y = np.array(np.array([1,2,3]), dtype=[('y', float)])

我有点疑惑。后者如何运作但numpy在提供简单列表时无法解决问题?

推荐的方式是什么?创建中间版array可能不会对性能产生很大影响,但这不是次优的吗?

我也很惊讶那些不会工作的人:

# All lists
y = np.array([[1,], [2,], [3,]], dtype=[('y', float)])
TypeError: expected an object with a buffer interface
# All tuples
y = np.array(((1,), (2,), (3,)), dtype=[('y', float)])
ValueError: size of tuple must match number of fields.

我是结构化数组的新手,我不记得numpy对输入类型的挑剔。必须有一些我不知道的东西。

2 个答案:

答案 0 :(得分:3)

np.array如何处理各种输入的详细信息隐藏在已编译的代码中。由于关于创建对象dtype数组的许多问题显示,它可能是复杂和令人困惑的。基本模型是从嵌套列表创建多维数字数组。

np.array([[1,2,3],[4,5,6]])

在实现结构化数组时,开发人员采用tuple作为区分记录与另一个嵌套维度的方法。这在结构化阵列的显示中很明显。

在定义结构化数组时也是一个要求,尽管list of tuples要求在文档中有些隐含。

In [382]: dt=np.dtype([('y',int)])
In [383]: np.array(alist,dt)

TypeError: a bytes-like object is required, not 'int'

这是我的版本' 1.12.0'错误信息。它似乎与你的不同。

正如您所注意到的,列表推导可以将嵌套列表转换为元组列表。

In [384]: np.array([tuple(i) for i in alist],dt)
Out[384]: 
array([(1,), (2,), (3,)], 
      dtype=[('y', '<i4')])

回答我最常使用的方法的问题。要么是迭代地设置预分配数组的字段(通常记录的字段多于字段,所以循环不贵)。

看起来在结构化数组调用中包装数组相当于astype调用:

In [385]: np.array(np.array(alist),dt)
Out[385]: 
array([[(1,)],
       [(2,)],
       [(3,)]], 
      dtype=[('y', '<i4')])
In [386]: np.array(alist).astype(dt)
Out[386]: 
array([[(1,)],
       [(2,)],
       [(3,)]], 
      dtype=[('y', '<i4')])

但请注意尺寸数量的变化。元组列表创建了一个(3,)数组。 astype(3,1)数字数组转换为(3,1)结构化数组。

元组告诉np.array的部分内容 - 在数组维度和记录之间划分&#39; here&#39;。它解释了

[(3,), (1,), (2,)]
[record, record, record]

[[1],[2],[3]]的自动翻译可能产生

[[record],[record],[record]]

当dtype是数字(非结构化)时,它忽略了list和tuple之间的区别

In [388]: np.array([tuple(i) for i in alist],int)
Out[388]: 
array([[1],
       [2],
       [3]])

但是当dtype是复合时,开发人员选择使用元组层作为重要信息。

考虑更复杂的结构化dtype

In [389]: dt1=np.dtype([('y',int,(2,))])
In [390]: np.ones((3,), dt1)
Out[390]: 
array([([1, 1],), ([1, 1],), ([1, 1],)], 
      dtype=[('y', '<i4', (2,))])
In [391]: np.array([([1,2],),([3,4],)])
Out[391]: 
array([[[1, 2]],

       [[3, 4]]])
In [392]: np.array([([1,2],),([3,4],)], dtype=dt1)
Out[392]: 
array([([1, 2],), ([3, 4],)], 
      dtype=[('y', '<i4', (2,))])

显示(和输入)列表中的元组内列表。这只是一个开始

In [393]: dt1=np.dtype([('x',dt,(2,))])
In [394]: dt1
Out[394]: dtype([('x', [('y', '<i4')], (2,))])
In [395]: np.ones((2,),dt1)
Out[395]: 
array([([(1,), (1,)],), ([(1,), (1,)],)], 
      dtype=[('x', [('y', '<i4')], (2,))])

convert list of tuples to structured numpy array

答案 1 :(得分:0)

np.array()函数接受列表列表作为输入。因此,例如,如果要创建2 * 2矩阵,这就是您需要做的

50
相关问题