我有一个具有分类值(每个分类为2-6个分类)的数据框。例如,制造工厂。我想使用线性回归(sklearn.linear_model)建立一个回归。但是,据我所知,Python没有R的Factor的类似物。Model拒绝使用字符串。在这种情况下,如何构建回归?有没有比创建带有0和1(Excel风格)的列堆更漂亮的解决方案?
顺便说一句,在ols(statsmodels.formula.api)中,有一个相对不错的解决方案。线性回归(sklearn.linear_model)有类似的东西吗?
fit = ols('Price ~ C(Cut) + Carat_weight', data=train).fit()
谢谢!很抱歉,问题太简单或不清楚。