比较两个分布与桶之间的关系

时间:2021-07-27 18:01:59

标签: machine-learning math statistics distribution probability-distribution

我想将以下分布与关键百分比进行比较。

<块引用>

dist1 = 200 - 0.1、201-0.1、500-0.8

<块引用>

dist2 = 200 - 0.15, 201 - 0.05, 500 - 0.8

<块引用>

dist3 = 200 - 0.1、201-0.05、500 - 0.85

dist1 是我的原始发行版。我想将它与 dist2 、 dist3 进行比较。当我使用 KL 散度之类的东西时,我得到 KL(dist2,dist1)> KL(dist3,dist1) 但在我目前的用例中正好相反,我想要一个指标,表示 dist2 比 dist3 更接近 dist1,因为只有更近的存储桶之间的变化,即 dist2 中的 200,201 与 dist1 相比,而 dist3 中的存储桶从 201 存储桶变为 500 存储桶。

在这种情况下,类似于 mean 的东西会起作用,但我想要一种更严格的方法来比较这些分布,以捕获所有变化。

谢谢

1 个答案:

答案 0 :(得分:1)

您可能需要查看Earth mover’s distance。这通过将概率质量视为一堆泥土,然后考虑泥土需要移动多少才能将一个分布转换为另一个分布来衡量两个分布之间的差异。移动污垢比移动污垢更短的距离需要更多的工作,而 KL 散度对概率质量移动的距离不敏感。

相关问题