线性回归拟合

时间:2020-07-01 15:19:56

标签: python machine-learning linear-regression

我首先进行了训练/测试拆分,然后将该数据拟合到如下所示的LinearRegression模型中

from nltk import everygrams

text = 'I like playing baseball'
grams = ['_'.join(grams) for grams in list(everygrams(text, 1, 2))]
grams

>> ['I', 'like', 'playing', 'baseball', 'I_like', 'like_playing', 'playing_baseball']

已给我另一个测试数据框,并希望使其适合已创建的Log_m模型。所以我做到了

X_train,X_test,y_train,y_test = train_test_split(X,y,test_size = 0.4, random_state = 101)

Log_m = LinearRegression()

Log_m.fit(X_train,y_train)

predictions = Log_m.predict(X_test)

但是我收到错误消息:

predictions_t = Log_m.predict(fin_df1_t)

这些是数据框的形状

ValueError: shapes (1450,262) and (282,) not aligned: 262 (dim 1) != 282 (dim 0)

1 个答案:

答案 0 :(得分:1)

新测试数据(262)的特征列与Xtrain和Xtest(282)的特征列不相等,因此它将始终产生错误。两者应具有相同的功能列。 例如,Xtrain和Xtest具有相同的列(282),因此该步骤没有错误。