我们可以使用百分位而不是分位数

时间:2017-01-02 07:30:50

标签: apache-spark statistics

我目前正在使用Scala处理Spark 1.6。我想获得整数列的分位数。不幸的是,Spark在1.6中没有任何分位数乐趣。但是,我发现我们在蜂巢中有percentile_approx()。这两者之间有什么显着差异吗?或者我可以只使用Percentile_approx而不是分位数?

0 个答案:

没有答案