我有一个线性回归测试,我试图在表格中比较测试结果。在我当前的设置下,我收到一个错误ValueError: If using all scalar values, you must pass an index
,我认为这与存储在DataFrame中的值的不同数据格式有关。我应该使用什么格式来实现此比较表?
这是我的代码:
print(type(y_test))
print(type(y_pred))
print(y_test)
print(y_pred)
# compare predictions to actuals
df_full_results = pd.DataFrame({'Actual': y_test, 'Predicted': y_pred})
# display results as table
display(HTML(df_full_results.to_html()))
以下是触发错误的代码:
df_full_results = pd.DataFrame({'Actual': y_test, 'Predicted': y_pred})
以下是输出:
<class 'pandas.core.frame.DataFrame'>
<class 'numpy.ndarray'>
b_leads
214 11
148 7
227 9
131 14
....
[63 rows x 1 columns]
[[14.03709801]
[ 6.58161653]
[13.02991554]
....
答案 0 :(得分:0)
您可以尝试将放入 DataFrame 的内容存储到变量中,然后将其放入 df_full_results。例如;
data_stuff = {'Actual': y_test,
'Predicted': y_pred
}
df_full_results = pd.DataFrame(data_stuff, columns=['Actual', 'Predicted'])