获取sklearn中映射的标签编码列表?

时间:2016-07-18 06:36:48

标签: scikit-learn

我有标签编码我的数据集,其中包含大约100多个不同的字符串。

那么,有什么办法可以在原始字符串旁边找到标签列表。

例如:

apple  --> 3
orange --> 4
pear   --> 1

1 个答案:

答案 0 :(得分:1)

来自sklearn.preprocessing.LabelEncoder的文档:

  

类_ :形状数组(n_class,)       为每个班级保留标签。

从中构建dict应该是微不足道的。

根据经验,sklearn阶段通常会将此类信息保留在以下划线结尾的某些成员中(例如,在这种情况下为classes_)。

示例

from sklearn import preprocessing
>>> preprocessing.LabelEncoder().fit(['apply', 'banana']).classes_
array(['apply', 'banana'], 
      dtype='|S6')