Statsmodels 均值差异的置信区间

时间:2021-01-31 10:56:14

标签: python pandas statsmodels

我想找到两个均值(男性与女性)之间差异的置信区间。我浏览了 statsmodels 的索引,找到了下面的函数。但是它没有解释我应该在哪里指定男性和女性系列。请指教。

enter image description here

功能:

CompareMeans.tconfint_diff(alpha=0.05, alternative='two-sided', usevar='pooled')

文档: https://www.statsmodels.org/stable/generated/statsmodels.stats.weightstats.CompareMeans.tconfint_diff.html

1 个答案:

答案 0 :(得分:2)

两个系列的描述性统计量应该以CompareMeans格式传递给DescrStatsW类。之后,您可以使用 tconfint_diff 类的 CompareMeans 方法获取均值差异的置信区间。

import pandas as pd
import numpy as np
from statsmodels.stats.weightstats import DescrStatsW, CompareMeans

df = pd.DataFrame({
    'Male': np.random.normal(loc=50, scale=5, size=100),
    'Female': np.random.normal(loc=50, scale=25, size=100),
})

cm = CompareMeans(d1=DescrStatsW(data=df['Male']), d2=DescrStatsW(data=df['Female']))

lower, upper = cm.tconfint_diff(alpha=0.05, alternative='two-sided', usevar='unequal')
相关问题