相同数据集的中位数和中位数差异的置信区间?

时间:2015-09-14 23:07:56

标签: r

对于两者之间的收入差异,建立95%的置信区间 高于男性中位数以及男性中位数以下。

哪些程序/脚本对R这样的问题有帮助?

能够使用如下命令:

# Use this command to calculate 95% confidence interval for difference in 
# height means between males and females
t.test(height ~ sex, data=CPS, conf.level=.95)

但是想不出找到相同数据集的低于中位数和高于中位数高度的置信区间的方法。有小费吗?对不起,R。

的新用户

1 个答案:

答案 0 :(得分:1)

(解决方案的提示/概要,因为这是作业。)

您没有明确说明您拥有的数据。有哪些变量和其他可用信息?

我的猜测是(它没有明确说明)您打算在样本中位数高度上执行此操作,而不是使用一些外部确定的中位数高度值。

您需要构建一个因子(至少是隐含的)来指示身高是否高于中位数身高。

[不幸的是,这会使问题中建议的测试/置信区间无效 - 请参阅stats.stackexchange上讨论该问题的几篇文章 - 但是现在让我们忽略它并将其视为纯R-代码问题。]

然后您需要构建置信区间,可能使用问题中的示例代码作为模板。

请注意,您正在与所有人的子集合作,因此您必须在调用函数执行CI之前或在其中之前在某个时刻对数据进行子集化。 (也就是说,这个问题有三个变量,一个响应,一个用于比较响应的因子和一个用于子集化的变量。)