进行特征选择的最佳方法是什么?

时间:2019-06-19 15:29:10

标签: python machine-learning scikit-learn data-science

我正在处理具有1500个特征的数据集,而没有有关其含义或派生方式的信息。该任务是对目标值进行回归。

基于树的特征重要性,我想减少尺寸的数量。 因此,我有一些问题:

  • 我在某处读到了(无法找到源代码...),ExtraTrees算法最适合计算功能重要性。您可以确认这句话吗?
  • 如何计算RadomForest,ExtraTree和GradientBoosting的功能重要性?
  • 优化算法的性能对特征重要性具有良好的信心有多重要?

谢谢您的帮助

0 个答案:

没有答案