将嵌套的numpy数组转换为2D数组

时间:2016-03-17 23:21:51

标签: python arrays numpy pandas scikit-learn

我正在使用Pandas来生成一些信息和功能。我将使用该数据库作为sklearn的输入。目前,我正在使用.as_matrix()将数据帧转换为数组。以下是输出:

array([[0.4437294900417328, 0.13434134423732758, 0.474, 0.482,
    array([0, 0, 0, 0, 0, 0, 1, 0, 0, 0])],
   [0.09896088391542435, 0.10105254501104355, 0.474, 0.526,
    array([0, 0, 0, 0, 0, 1, 0, 0, 0, 0])],
   [0.026971107348799706, 0.08766224980354309, 0.474, 0.581,
    array([0, 0, 0, 0, 0, 0, 1, 0, 0, 0])],
   ..., 

我想将这个内部数组解析为父2D数组。结果看起来应该是这样的。

array([[0.4437294900417328, 0.13434134423732758, 0.474, 0.482,
    0, 0, 0, 0, 0, 0, 1, 0, 0, 0],
   [0.09896088391542435, 0.10105254501104355, 0.474, 0.526,
    0, 0, 0, 0, 0, 1, 0, 0, 0, 0],
   [0.026971107348799706, 0.08766224980354309, 0.474, 0.581,
    0, 0, 0, 0, 0, 0, 1, 0, 0, 0],
   ..., 

TIA

1 个答案:

答案 0 :(得分:0)

正如我评论的那样,阵列的确切结构尚不清楚。我确定外部dtype是对象。熊猫经常使用它来保存混合数据。

这是猜测,可能的解决方案:

创建一个对象数组并用一些浮点数和整数数组填充它:

In [38]: A=np.empty((3,5),dtype=object)
In [39]: A[:,:4]=np.arange(12.).reshape(3,4)/10
In [40]: A[0,-1]=np.arange(5)
In [41]: A[1,-1]=np.arange(1,6)
In [42]: A[2,-1]=np.arange(2,7)
In [43]: A
Out[43]: 
array([[0.0, 0.1, 0.2, 0.3, array([0, 1, 2, 3, 4])],
       [0.4, 0.5, 0.6, 0.7, array([1, 2, 3, 4, 5])],
       [0.8, 0.9, 1.0, 1.1, array([2, 3, 4, 5, 6])]], dtype=object)

打印类似。 reshapeconcatenateravel等不加入浮点数和数组。

而是让数组保存预期的值,并将它们复制到它:

In [44]: B=np.zeros((3,9),float)
In [45]: B[:,:4]=A[:,:4]

复制浮动列很容易。但是,将数组重新编写为可以作为块复制的内容,需要连接。 vstack形式似乎可以解决问题:

In [46]: B[:,4:]=np.vstack(A[:,-1])
In [47]: B
Out[47]: 
array([[ 0. ,  0.1,  0.2,  0.3,  0. ,  1. ,  2. ,  3. ,  4. ],
       [ 0.4,  0.5,  0.6,  0.7,  1. ,  2. ,  3. ,  4. ,  5. ],
       [ 0.8,  0.9,  1. ,  1.1,  2. ,  3. ,  4. ,  5. ,  6. ]])

我必须根据我对数组显示的了解重新创建数组,包括对象类型。然后我不得不四处游玩,尝试各种方式加入价值观。所以有很多试验和错误。