分档-等频:边界和间隔

时间:2019-06-15 08:32:03

标签: data-science binning

我目前正在学习Binning方法,但是我在等频Binning中苦苦挣扎。 学习时,我有以下示例,但我不清楚。数据集如下所示:

5,12,25,25,25,34,37,46,47,47

然后,老师分了2个百分点:

bin 1:[5,25]

bin 2:(25,47]

现在

  1. 为什么Bin 2的下端是一个打开间隔,而其余的都关闭了?

  2. 为什么Bin 2的下边界值为25?我认为垃圾箱中的值将是:

bin 1:{5,12,25,25,25}

bin 2:{34,37,46,47,47}

  1. 如果添加了新值(例如25)会发生什么?

  2. 此示例看起来像四分位数(因此所有具有25%数据的bin)?

希望有人可以回答我:-)

0 个答案:

没有答案
相关问题