我使用 DBSCAN 算法对我的数据集进行了聚类,但我想在使用轮廓度量来衡量内部有效性之前删除异常值:
这是我的代码:
X=reduction_SVD(df)
model= DBSCAN(eps=eps, min_samples=min_samples, n_jobs=-1)
model.fit(X)
labels = model.labels_
###################################
# I want to remove outliers in here
###################################
if n_clusters_>1:
metrics.silhouette_score(X, labels)
在将 X 和标签发送到 Silhouette_score 函数之前,我想从 X 和标签中删除标签值等于 -1 的行(-1 是噪声的簇数)