ValueError:找到样本数不一致的输入变量:[1,14048]

时间:2017-02-13 01:40:34

标签: machine-learning scikit-learn naivebayes multinomial

我正在尝试运行MultinomiaL Naive bayes并收到以下错误。提供样本培训数据。测试数据完全相似。

def main():
    text_train, targets_train = read_data('train')
    text_test, targets_test = read_data('test')
    classifier1 = MultinomialNB()
    classifier1.fit(text_train, targets_train)
    prediction1 = classifier1.predict(text_test)

示例数据:

Train: 
category, text
Family, I love you Mom
University, I hate this course

1 个答案:

答案 0 :(得分:0)

有时我会面对这个问题,并且从错误中找出大部分原因是输入数据应该是2-D数组,例如如果要构建回归模型。你写这个代码然后你将面临这个错误!

例如:

a = np.array([1,2,3]).T
b = np.array([4,5,6]).T

regr = linear_model.LinearRegression()
regr.fit(a, b)

然后你应该添加一些东西!

a = np.array([[1,2,3]]).T
b = np.array([[4,5,6]]).T

最后你会正常运行! 所以这只是我的经验! 这只是一个参考,而不是标准答案! 我来自中国,是一名学习英语和蟒蛇的学生!