当我使用chi2测试仅选择20%最重要的功能时,如何获取功能名称?

时间:2014-01-20 20:35:09

标签: numpy pandas scikit-learn

这是我在“学习scikit-learn:

”一书中找到的代码片段
from sklearn import feature_selection
fs = feature_selection.SelectPercentile(feature_selection.chi2, percentile=20)
X_train_fs = fs.fit_transform(X_train, y_train)

我想要的是一系列功能名称和相对重要性。

我在Stack(show feature names after feature selection)中发现了这段代码,但是并没有完全理解它,也无法让它工作。

我很欣赏有关如何获取,存储和打印功能的建议。谢谢你的帮助。

1 个答案:

答案 0 :(得分:1)

感谢EdChum

,这是代码

.....将数据读入numpy数组

....获取要素名称并放入feature_names

from sklearn import feature_selection
fs = feature_selection.SelectPercentile(feature_selection.chi2, percentile=20)
X_train_fs = fs.fit_transform(plants_X, plants_y)

print feature_names, '\n', fs.scores_