如何在线性回归中充分使用分类变量

时间:2020-02-09 21:16:52

标签: python linear-regression categorical-data sklearn-pandas

我有一个具有分类值(每个分类为2-6个分类)的数据框。例如,制造工厂。我想使用线性回归(sklearn.linear_model)建立一个回归。但是,据我所知,Python没有R的Factor的类似物。Model拒绝使用字符串。在这种情况下,如何构建回归?有没有比创建带有0和1(Excel风格)的列堆更漂亮的解决方案?

顺便说一句,在ols(statsmodels.formula.api)中,有一个相对不错的解决方案。线性回归(sklearn.linear_model)有类似的东西吗?

fit = ols('Price ~ C(Cut) + Carat_weight', data=train).fit()

谢谢!很抱歉,问题太简单或不清楚。

0 个答案:

没有答案
相关问题