Question

我首先进行了训练/测试拆分，然后将该数据拟合到如下所示的LinearRegression模型中

from nltk import everygrams

text = 'I like playing baseball'
grams = ['_'.join(grams) for grams in list(everygrams(text, 1, 2))]
grams

>> ['I', 'like', 'playing', 'baseball', 'I_like', 'like_playing', 'playing_baseball']

已给我另一个测试数据框，并希望使其适合已创建的Log_m模型。所以我做到了

X_train,X_test,y_train,y_test = train_test_split(X,y,test_size = 0.4, random_state = 101)

Log_m = LinearRegression()

Log_m.fit(X_train,y_train)

predictions = Log_m.predict(X_test)

但是我收到错误消息：

predictions_t = Log_m.predict(fin_df1_t)

这些是数据框的形状

ValueError: shapes (1450,262) and (282,) not aligned: 262 (dim 1) != 282 (dim 0)

Answer 1

新测试数据（262）的特征列与Xtrain和Xtest（282）的特征列不相等，因此它将始终产生错误。两者应具有相同的功能列。例如，Xtrain和Xtest具有相同的列（282），因此该步骤没有错误。

线性回归拟合

1 个答案: