如何使用LDA获取主题建模的每个文档的主题概率

时间:2018-04-09 19:53:48

标签: scikit-learn lda topic-modeling

我使用scikit-learn LDA生成LDA模型,之后我可以获得主题术语。我想知道如何获得每个文档的每个主题的概率?

1 个答案:

答案 0 :(得分:1)

在拟合模型后使用transform类的LatentDirichletAllocation方法。它将返回文档主题分发。

如果您使用example given in the documentation进行scikit-learn的Latent Dirichlet分配,可以通过在代码中附加以下行来访问文档主题分发:

doc_topic_dist = lda.transform(tf)

此处,lda是经过培训的LDA模型,tf是文档字矩阵。