找到包含不一致样本数的输入变量:

时间:2017-05-07 12:50:29

标签: python csv

我想用下面的代码计算线性回归; 但我在线上有一个错误"预测= cross_val_predict(lr,x,y,cv = 10)" 注意;所有进口都没问题

  

找到样本数不一致的输入变量:[1,4538]

df = pd.read_csv(r'...movie_metadata.csv')
x = df.budget.tolist()
y = df.imdb_score.tolist()

lr = linear_model.LinearRegression()



predicted = cross_val_predict(lr, x, y, cv=10)

fig, ax = plt.subplots()
ax.scatter(y, predicted)
ax.plot([y.min(), y.max()], [y.min(), y.max()], 'k--', lw=4)
ax.set_xlabel('Measured')
ax.set_ylabel('Predicted')
plt.show()

0 个答案:

没有答案