如何显示模型的输出?

时间:2016-01-20 19:05:15

标签: python machine-learning scikit-learn logistic-regression

我正在执行机器学习任务,其中我使用逻辑回归进行主题分类。

如果这是我的代码:

model= LogisticRegression()
model= model.fit(mat_tmp, label_tmp)

y_train_pred = model.predict(mat_tmp_test)

print(metrics.accuracy_score(label_tmp_test, y_train_pred))

有没有办法可以输出模型中正在发生的事情。就像我的模型正在做的一个工作示例一样?比如可能会显示2-3个文档以及它们是如何分类的?

1 个答案:

答案 0 :(得分:2)

为了充分了解模型中发生的事情,您必须先花些时间研究逻辑回归算法(例如,从讲义或Wikipedia)。与其他监督技术一样,逻辑回归具有超参数和参数。超参数基本上指定了算法的运行方式,您必须在初始化时提供(即在它看到任何数据之前)。例如,您可以获得有关类分布的先验信息,然后这将是一个超参数。参数是"学习"来自您的数据。

一旦理解了算法,有趣的问题就是模型的参数是什么(回想一下,这些是从数据中检索出来的)。通过访问documentation,您可以在属性部分中找到此分类器有3个参数,您可以通过其字段名称访问这些参数。

如果您对这些细节不感兴趣,但只想评估分类器的准确性,那么有用的技术就是交叉验证。您将标记数据拆分为 k 相等大小的子集,并使用 k-1 训练您的分类器。然后,您在剩余的1个子集上评估训练的分类器并计算准确度(即,可以正确预测数据的比例)。这种方法有其缺点,但一般来说证明非常有用。

相关问题