Question

我正在执行机器学习任务，其中我使用逻辑回归进行主题分类。

如果这是我的代码：

model= LogisticRegression()
model= model.fit(mat_tmp, label_tmp)

y_train_pred = model.predict(mat_tmp_test)

print(metrics.accuracy_score(label_tmp_test, y_train_pred))

有没有办法可以输出模型中正在发生的事情。就像我的模型正在做的一个工作示例一样？比如可能会显示2-3个文档以及它们是如何分类的？

Answer 1

为了充分了解模型中发生的事情，您必须先花些时间研究逻辑回归算法（例如，从讲义或Wikipedia）。与其他监督技术一样，逻辑回归具有超参数和参数。超参数基本上指定了算法的运行方式，您必须在初始化时提供（即在它看到任何数据之前）。例如，您可以获得有关类分布的先验信息，然后这将是一个超参数。参数是＆＃34;学习＆＃34;来自您的数据。

一旦理解了算法，有趣的问题就是模型的参数是什么（回想一下，这些是从数据中检索出来的）。通过访问documentation，您可以在属性部分中找到此分类器有3个参数，您可以通过其字段名称访问这些参数。

如果您对这些细节不感兴趣，但只想评估分类器的准确性，那么有用的技术就是交叉验证。您将标记数据拆分为 k 相等大小的子集，并使用 k-1 训练您的分类器。然后，您在剩余的1个子集上评估训练的分类器并计算准确度（即，可以正确预测数据的比例）。这种方法有其缺点，但一般来说证明非常有用。

如何显示模型的输出？

1 个答案: