Seaborn中堆积的条形图

时间:2019-11-25 19:39:22

标签: matplotlib seaborn

我有以下数据:

countries2012 = [
    'Bolivia',
    'Brazil',
    'Sri Lanka',
    'Dominican Republic',
    'Indonesia',
    'Kenya',
    'Honduras',
    'Mozambique',
    'Peru',
    'Philipines',
    'India',
    'Vietnam',
    'Thailand',
    'USA',
    'World'
]

percentage2012 = [ 
    0.042780099,
    0.16599952,
    0.012373058,
    0.019171717,
    0.011868674,
    0.019239173,
    0.00000332,
    0.014455196,
    0.016006654,
    0.132970981,
    0.077940824,
    0.411752517,
    0.017986798,
    0.017361808,
    0.058076027
]

countries2013 = [
    'Bolivia',
    'Brazil',
    'Sri Lanka',
    'Dominican Republic', 
    'Indonesia', 
    'Honduras',
    'Mozambique', 
    'Peru', 
    'Philippines', 
    'India', 
    'Vietnam', 
    'Thailand', 
    'USA',
    'World'  
]

percentage2013 = [
    0.02736294,
    0.117160272, 
    0.015815952 ,
    0.018831589,
    0.020409103 ,
    0.00000000285,
    0.018876854,
    0.018998639,
    0.117221146,
    0.067991687,
    0.496110972,
    0.019309486,
    0.026880553,
    0.03503080414999993
]

我想绘制一个堆积条形图,以便有一个堆积条形用于2012年,另一个堆积条形用于2013年。

由于2012年和2013年的国家不同,我该如何处理?

3 个答案:

答案 0 :(得分:13)

由于此问题要求在 Seaborn 中使用堆积条形图,并且接受的答案使用 pandas,因此我想我会给出一种实际使用 Seaborn 的替代方法。

Seaborn 给出了一个 stacked bar 示例,但它有点笨拙,绘制总数然后在其上叠加条形图。相反,您实际上可以使用直方图和 weights 参数。

import pandas as pd
import seaborn as sns

# Put data in long format in a dataframe.
df = pd.DataFrame({
    'country': countries2012 + countries2013,
    'year': ['2012'] * len(countries2012) + ['2013'] * len(countries2013),
    'percentage': percentage2012 + percentage2013
})

# One liner to create a stacked bar chart.
ax = sns.histplot(df, x='year', hue='country', weights='percentage',
             multiple='stack', palette='tab20c', shrink=0.8)
ax.set_ylabel('percentage')
# Fix the legend so it's not on top of the bars.
legend = ax.get_legend()
legend.set_bbox_to_anchor((1, 1))

seaborn stacked bar chart

答案 1 :(得分:1)

IIUC,您可以创建一个Pandas数据框并使用其绘图功能:

import pandas as pd
df = pd.concat([pd.DataFrame({2012:percentage2012}, index=countries2012),
                pd.DataFrame({2013:percentage2013}, index=countries2013)],
               axis=1, sort=False)

df.T.plot.bar(stacked=True, figsize=(12,6))

输出:

enter image description here

答案 2 :(得分:0)

以@Quang Hoang的代码为基础,此处尝试以相同顺序获取图例和堆栈(在2012年更正了“ Philippines”之后)。由于某些原因,2012年的百分比之和未达到100%,因此我添加了标准化步骤。此外,我将x标签水平放置,将y标签放置为百分比。

代码:

import pandas as pd
from matplotlib import pyplot as plt

df = pd.concat([pd.DataFrame({'2012':percentage2012[::-1]}, index=countries2012[::-1]) / sum(percentage2012),
                pd.DataFrame({'2013':percentage2013[::-1]}, index=countries2013[::-1]) / sum(percentage2013)],
                axis=1, sort=False)

df.T.plot.bar(stacked=True, figsize=(12,6), cmap='tab20')
ax = plt.gca()
h, l = ax.get_legend_handles_labels()
plt.legend(h[::-1], l[::-1])
plt.xticks(rotation=0, size=20)
plt.yticks(size=15)

vals = ax.get_yticks()
ax.set_yticklabels(['{:,.0%}'.format(y) for y in vals])

plt.show()

the resulting bar chart