ValueError:未知标签类型:'未知' -Labels是数字

时间:2017-10-05 04:00:17

标签: python scikit-learn random-forest grid-search

我正在为二进制分类问题构建一个随机森林分类器。我的标签都是数字。

print labels.unique()
[1 0]

print type(labels)
    <class 'pandas.core.series.Series'>
print labels.shape
(3000,)

但是当我使用Gridsearchcv

拟合模型时
pipeline = Pipeline(steps=[('scaler', scaler), ('algorithm', algo)])
cv = StratifiedShuffleSplit(labels, 5, test_size=0.25, random_state=42)
gs = GridSearchCV(pipeline, param_grid, cv=cv, scoring='f1')
gs.fit(features, labels)

我收到此错误

ValueError: Unknown label type: 'unknown'

但是当我使用

gs.fit(features, labels.astype(int))

工作正常。有人让我知道标签中的问题在哪里?

1 个答案:

答案 0 :(得分:2)

您只需使用tolist()方法更改要列出的标签类型即可。使用

labels_lst = labels.tolist()

Scikit-learn无法自动将系列转换为标签列表。