我想对短文本进行主题建模。我对LDA进行了一些研究,发现它与短文本配合得不好。哪种方法会更好,并且它们具有Python实现?
答案 0 :(得分:3)
您可以尝试使用短文本主题建模(请参考https://www.groundai.com/project/sttm-a-tool-for-short-text-topic-modeling/1)(可在https://github.com/qiang2100/STTM上找到代码)。它结合了最新的算法和长主题的传统主题建模,可方便地用于短文本。
有关更专业的库,请尝试lda2vec-tf,它将字向量与LDA主题向量结合在一起。它从原始的lda2vec分支而来,经过改进,比原始库提供更好的结果。
答案 1 :(得分:1)
短文本主题建模的唯一Python实现是GSDMM。不幸的是,其他大多数都是用Java编写的。
答案 2 :(得分:1)