熊猫DataFrame标量值索引传递

时间:2018-11-08 18:08:36

标签: python pandas dataframe

我有一个线性回归测试,我试图在表格中比较测试结果。在我当前的设置下,我收到一个错误ValueError: If using all scalar values, you must pass an index,我认为这与存储在DataFrame中的值的不同数据格式有关。我应该使用什么格式来实现此比较表?

这是我的代码:

print(type(y_test))
print(type(y_pred))

print(y_test)
print(y_pred)

# compare predictions to actuals
df_full_results = pd.DataFrame({'Actual': y_test, 'Predicted': y_pred})

# display results as table
display(HTML(df_full_results.to_html()))

以下是触发错误的代码:

df_full_results = pd.DataFrame({'Actual': y_test, 'Predicted': y_pred})

以下是输出:

<class 'pandas.core.frame.DataFrame'>
<class 'numpy.ndarray'>

 b_leads
214      11
148       7
227       9
131      14
....

[63 rows x 1 columns]
[[14.03709801]
 [ 6.58161653]
 [13.02991554]
....

1 个答案:

答案 0 :(得分:0)

您可以尝试将放入 DataFrame 的内容存储到变量中,然后将其放入 df_full_results。例如;

data_stuff = {'Actual': y_test,
              'Predicted': y_pred
             }
df_full_results = pd.DataFrame(data_stuff, columns=['Actual', 'Predicted'])