AUROCs的正态分布

时间:2016-05-24 10:00:03

标签: machine-learning data-mining

我一直在执行多次交叉验证并获得几个AUROC(ROC下的区域)。我发现那些AUC的分布遵循正态分布。对此有任何科学解释吗?感谢。

2 个答案:

答案 0 :(得分:0)

无法正常分配AUROC值。

因为正态分布是无限的,但是AURUC被限制为[0:1]。因此,它最多看起来像一个正常的分布。

您更有可能观察到二项分布

对AUROC有概率解释(对不起,我不记得这个来源)。假设有一个" true"概率p,你从这个真概率p观察k个随机样本,AUROC值的分布可能是B(n,p)/ n那么?

答案 1 :(得分:0)

中心极限定理通常用于证明在大量数据上计算的统计量(样本)分布的近似正态性。对于接近0或1的AUC,这显然会崩溃,因为正态分布在整个实线上都有支持。

为什么要关心?这只是为了好奇还是你想用这种直觉做点什么?

如果要计算间隔,更好的方法是使用引导程序。如果您要比较两个模型的ROC,您可以引导两个模型的配对决策,以获得差异的间隔。