Python NetworkX将Panda的int转换为float

时间:2018-09-30 22:05:23

标签: python pandas networkx

我正在尝试从pandas数据框构建networkx图,并在绘制时为节点设置位置数组。我遇到的问题是将熊猫列作为边缘属性。如果属性列的类型为float,它将把节点ID(int)的值转换为float类型,这将导致在networkx的draw函数的位置数组中建立索引的问题。

可以通过在属性之后显式添加属性来解决此问题。 创建了节点和边,但是我觉得应该有一种方法可以使它起作用,所以我缺少明显的东西。

感谢您的帮助。

import networkx as nx
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

#set up datae frame
UpNodes  =np.array([0,0,1,1,2,2,6,6,8,8,10], dtype=np.int)
DownNodes=np.array([1,2,3,4,4,5,7,8,9,10,11], dtype=np.int)
ORDER    =np.array([2,1,1,1,3,2,1,1,1,2,3],dtype=np.float) #toggle this from int to float

df=pd.DataFrame(
{'UpNodes': UpNodes,
 'DownNodes':DownNodes,
 'ORDER': ORDER},
 columns=['UpNodes','DownNodes','ORDER'])

#create array of spatial positions for nodes
pos=np.array(
[[ 0., 0.  ],
 [ 1., 0.5 ],
 [ 1., -0.5 ],
 [ 2., 1.  ],
 [ 2., 0.25],
 [ 2., -1.  ],
 [ 3., 2.  ],
 [ 4., 3.  ],
 [ 4., 1.  ],
 [ 5., 2.  ],
 [ 5., 0.  ],
 [ 6., 0.  ]]
)

plt.figure('Im a plot')

print df
print df.dtypes
G=nx.from_pandas_edgelist(df,'UpNodes','DownNodes','ORDER')
print G.edges

nx.draw(G, pos, node_size=90, with_labels=False)

print 'Done'

plt.show()

1 个答案:

答案 0 :(得分:0)

好吧,这确实有助于阅读文档。对于任何想解决这个问题的人,您都可以编写自己的代码来使用itertuples而不是iterrows,而这并不节省dtype。

def pandas_to_Network(df,UpNode,DownNode,Attributes):
    #Create a graph
    G=nx.Graph()
    #Loop through the pandas dataframe and add edges
    for row in df.itertuples():
        #convert edge attributes to dictionary form
        edgedata={}
        for edge_key in Attributes:
            edgedata.update({edge_key:getattr(row,edge_key)})

        #create edge
        G.add_edge(getattr(row,UpNode), getattr(row,DownNode),**edgedata)

    return G

其中的属性是列标题的列表(在我的情况下为['ORDER'])