我正在寻找java中PLSA的任何教程或实现。此链接https://stackoverflow.com/questions/16396463/probabilistic-latent-semantic-analysis-indexing-in-java中存在类似问题,但此查询膨胀没有回复。我看过托马斯霍夫曼关于PLSA的谈话,但我似乎无法理解实施情况。任何帮助将不胜感激。
答案 0 :(得分:0)
根据wikipedia:
P(w,d) = \sum_c P(c) P(d|c) P(w|c) = P(d) \sum_c P(c|d) P(w|c)
这是您需要实施的公式。
此外,EM algorithm是您所需要的。如果您不理解算法或函数,则无法成功成为它的消费者。