使用logit的样本比例置信区间估计

时间:2018-04-14 14:31:04

标签: math statistics probability intervals

这似乎是一个问题,具有公认的,统计上和数学上合理的答案,但我似乎无法找到它。

从样本比例估算置信区间时,我通常使用此处描述的常规逼近技术:https://en.wikipedia.org/wiki/Binomial_proportion_confidence_interval#Normal_approximation_interval

然而,对于我的样本接近0或1的比例,这显然失败,特别是具有对称分布,导致其高于1或低于0.通常,因为当使用logit建模时比例估计“表现更好”,我假设有一些方法可以将logit变换应用于置信区间,从而导致不对称的置信区间永远不会越过0或1。

然而,我并没有试图将我自己的技术与新生微积分和MBA统计数据结合起来作为我最高级的正式数学训练,而是在网上搜索这种技术是否已经被更有资格的人描述过。

是否有人知道这样做的方法?

1 个答案:

答案 0 :(得分:0)

通过通常的变量变量公式直接推导显示y = logit(x)其中x具有β分布(二项式比例的后验分布假设β先验),具有pdf {{1}的分布} (exp(y)^a)/((1 + exp(y))^(a + b))/beta(a, b)

pdf具有类似高斯的形状,但a和b越不同,它的对称性越低。它可能有一个名字,虽然我不认识它。

目前尚不清楚在这里采用y = logit(x)是有帮助的。对于其他几种方法,请参阅:Binomial proportion confidence interval

统计问题可能应该发送到stats.stackexchange.com。