大量变量之间的相关性

时间:2017-07-12 17:18:17

标签: python pandas

我有一个包含30个变量的数据框,我想知道它们之间的相关变量。我使用了df.corr()但结果似乎很难理解,因为它包含一个大矩阵。

有没有办法建立一个热图,或者得到相关系数大于或小于某个固定值的相关对(例如-r <-0.8&amp; r&gt; 0.8)?

1 个答案:

答案 0 :(得分:0)

seaborn包装具有创造热图的卓越功能。 http://seaborn.pydata.org/index.html

以下是一段示例代码,它产生相关矩阵的热图。

df= pd.DataFrame(np.random.randint(1,4,[72,5]))
df.columns = ['col1','col2','col3','col4','col5']
import seaborn as sns
sns.heatmap(df.corr())
plt.yticks(rotation= 0)
plt.xticks(rotation=90)

enter image description here