使用Latent Dirichlet分配的主题预测

时间:2011-04-07 14:39:55

标签: python prediction topic-modeling

我在文档语料库中使用了LDA并找到了一些主题。我的代码输出是包含概率的两个矩阵。一个doc-topic概率和另一个word-topic概率。但我实际上不知道如何使用这些结果来预测新文档的主题。我正在使用Gibbs采样。有谁知道怎么样? 感谢

1 个答案:

答案 0 :(得分:3)

Java实现http://www.arbylon.net/projects/lda-j/lda-j-src-20050325.zip在src \ org \ knowceans \ lda \ SearchEnglet.java中有一个简短的示例程序。我希望你对java有点熟悉,代码可以帮助你。

原始论文http://jmlr.csail.mit.edu/papers/volume3/blei03a/blei03a.pdf描述了5.1和5.2节中的推论。