Question

当我使用sklearn构建决策树时，示例：

clf = tree.DecisionTreeClassifier()
clf = clf.fit(X,Y)
result = clf.predict(testdata)

X是训练输入样本，如果X中有“无”，该怎么办？

Answer 1

决策树和随机森林等集合方法（基于此类树）只接受数值数据，因为它在树的每个节点上执行拆分，以便最小化a给定杂质函数（熵，基尼指数......）

如果您的数据中有某些分类功能或某些Nan，则学习步骤会出错。

规避：

警告：如果您的功能包含许多类别（例如ID功能），OneHotEncoding可能会导致内存问题。尽量避免对这些功能进行编码。

完成预处理后，您可以将决策树放入数据中。