将Python嵌套Dict转换为Numpy数组

时间:2018-06-27 16:55:36

标签: python json dictionary numpy-ndarray

我有一本字典,格式为:

{"k": {"k1": [[v1]],"k2": [[v2]],"k3": [[v3]]}

如何将其转换为以下格式的两个数组:

[kk1,kk2,kk3]
[v1,v2,v3]

我在Python中有一个函数,但是无法获得所需格式的结果。

def dict_to_list_of_keys(d, l, loc):
    for k in iter(d):
        loc.append(k)
        l.append(loc * 1)
        if isinstance(d[k], dict):
            dict_2_list_of_keys(d[k], l, loc)
        loc.pop()
    return l

3 个答案:

答案 0 :(得分:1)

我会为此使用熊猫。首先从字典创建一个数据框。

import pandas as pd
import numpy as np

dict_test = {"k": {"k1": [['v1']],"k2": [['v2']],"k3": [['v3']]}}

df = pd.DataFrame.from_dict(dict_test)

Pandas巧妙地将键值作为索引,并将实际列表值作为数据。现在,您可以对数据框架进行子集化,以任意方式提取数据。一种建议是从索引中创建一个新列,如下所示:

df['key_value'] = df.index

现在,您可以像其他任何列一样引用键值。如果您有更复杂的字典,大熊猫会为每个键/值对创建一列,这意味着您可能必须将数据框融合为更有用的形状。

最后,如果您随后想要转换为沿行某处的numpy数组,由于每个单独的列表都是数据框中的一个单元格,您应该使用诸如apply(假设df现在只是列表的单列)之类的东西

df.apply(lambda x: np.array(x))

您将为数据框中的每一行返回一个numpy数组。希望这会有所帮助。

答案 1 :(得分:1)

通过for使用list.append循环。将列表转换为数组很简单,即np.array(L)

d = {"k": {"k1": [['v1']],"k2": [['v2']],"k3": [['v3']]}}

keys, values = [], []

for k1, v1 in d.items():
    for k2, v2 in v1.items():
        keys.append(k1+k2)
        values.append(v2[0][0])

print(keys, values, sep='\n')

['kk1', 'kk2', 'kk3']
['v1', 'v2', 'v3']

答案 2 :(得分:0)

这是一种方式:

import numpy as np

d = {"k": {"k1": [['v1']],"k2": [['v2']],"k3": [['v3']]}}

lst = []
for k, v in d.items():
    for k1, v1 in v.items():
        lst.extend([(k+k1, v1[0][0])])

print(np.array(list(zip(*lst))))
# [['kk1' 'kk2' 'kk3']
#  ['v1' 'v2' 'v3']]