如何通过gensim在训练有素的LDA模型上保存火车组的分布?

时间:2014-12-08 09:26:26

标签: python lda gensim

代码的最后部分:

lda = models.LdaModel(corpus_tfidf, id2word = dic, num_topics = 64)
corpus_lda = lda[corpus_tfidf]

我想知道如何保存corpus_lda以供进一步使用?

1 个答案:

答案 0 :(得分:2)

Gensim具有将语料库写入磁盘的功能:

from Gensim import corpora
corpora.MmCorpus.serialize('pathandfilename.mm', corpus_lda) 

要加载已保存的语料库使用:

corpus_lda = corpora.MmCorpus('pathandfilename.mm')

保存模型有类似的功能(查看教程或references)。 有不同的语料库格式,我相信矩阵市场曾经是Gensim使用的标准格式,但最近添加了indexedcorpus格式,它有一些额外的功能(索引,你可能已经猜到了)。