我正在使用来自kaggle(link)和xgboost的houseprices数据集。
为了改进我的模型,我想要了解对目标变量(房屋的销售价格)执行日志转换是否有意义。我在cross_val_score中用neg_mean_absolute_error测量我的模型的性能。直觉上,我想对错误执行逆变换,但这不起作用。
# without transformation
cv_score.mean() = -16102.123159086292
# with transformation
y_t = np.log1p(y)
...
cv_score.mean() = -0.08614553190770206
np.exp1p(cv_score.mean()) = -0.08253929830217616
您对此如何运作有任何建议吗?
答案 0 :(得分:0)
您应该使用转换将模型生成的预测转换回来。 然后像另一种情况一样评估模型