我想使用Y = M_1*X_1 + M_2*X_2
来训练具有多维输入和输出样本(例如向量)的线性模型sklearn
。我尝试了以下代码:
from sklearn import linear_model
from pandas import DataFrame
x1 = [[1,2],[2,3],[3,4]]
x2 = [[1,1],[3,2],[3,5]]
y = [[1,0],[1,2],[2,3]]
model = {
'vec1': x1,
'vec2': x2,
'compound_vec': y}
df = DataFrame(model, columns=['vec1','vec2','compound_vec'])
x = df[['vec1','vec2']].astype(object)
y = df['compound_vec'].astype(object)
regr = linear_model.LinearRegression()
regr.fit(x,y)
但是出现以下错误:
regr.fit(x,y)
...
array = array.astype(np.float64)
ValueError: setting an array element with a sequence.
有人知道代码有什么问题吗?如果这是训练Y = M_1*X_1 + M_2*X_2
的正确方法?
答案 0 :(得分:2)
只需展平您的x1
,x2
和y
列表,您就可以开始了。一种方法是使用数组,如下所示:
import numpy as np
x1 =np.array(x1).flatten()
x2 =np.array(x2).flatten()
y =np.array(y).flatten()
第二种方法是将ravel
用作:
x1 =np.array(x1).ravel()
x2 =np.array(x2).ravel()
y =np.array(y).ravel()
不使用NumPy的第三种方法是使用列表理解为:
x1 =[j for i in x1 for j in i]
x2 =[j for i in x2 for j in i]
y =[j for i in y for j in i]
可能还有更多方法,但是您发现了问题所在。有关更多方法,您可以看看here
输出
LinearRegression(copy_X=True, fit_intercept=True, n_jobs=1, normalize=False)