概率潜在语义分析

时间:2013-07-17 12:39:02

标签: java algorithm lsa

我正在寻找java中PLSA的任何教程或实现。此链接https://stackoverflow.com/questions/16396463/probabilistic-latent-semantic-analysis-indexing-in-java中存在类似问题,但此查询膨胀没有回复。我看过托马斯霍夫曼关于PLSA的谈话,但我似乎无法理解实施情况。任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:0)

根据wikipedia

P(w,d) = \sum_c P(c) P(d|c) P(w|c) = P(d) \sum_c P(c|d) P(w|c) 

这是您需要实施的公式。

此外,EM algorithm是您所需要的。如果您不理解算法或函数,则无法成功成为它的消费者。