在DBSCAN中,eps实际代表什么?

时间:2015-04-27 04:13:50

标签: cluster-analysis data-mining dbscan

假设我已经找到所有密度的 eps 。我从这里应用了这种方法https://www.google.com/webhp?sourceid=chrome-instant&ion=1&espv=2&ie=UTF-8#q=systemtimer%20gem

如果您不介意,请打开第5页,查看“建议的算法”部分。在步骤10.1,该文件告诉我们计算 eps-neighborhood 中的对象数量。

eps 实际代表什么?画圆圈的半径是对的吗?那么,为什么半径如此之小,小于两个物体之间的距离?如果是这样,MinPts将永远为0。

2 个答案:

答案 0 :(得分:0)

是的,如果与欧几里德距离一起使用,则它是半径。

它不是无限小(它不倾向于0 )。与数据集扩展相比,它应该是小的,但作者可能会将其命名为“r”。

使用原始论文来理解算法,而不是一些印度期刊的变体。

答案 1 :(得分:0)

在欧氏距离中,它是半径。选择Eps有点困难。

该问题与模型选择有关,即选择特定模型及其相应的参数化。在k-means(需要用户使用簇的数量作为输入)的情况下,文献中有大量的测量可以帮助选择最佳数量的簇,例如:silhouette,c-index ,dunn,davies-bouldin。这些措施就是所谓的相对有效性标准。

对于基于密度的聚类算法,也有一些措施,例如:CDbw和DBCV。