使用LDA进行主题建模

时间:2019-06-17 11:42:07

标签: python deep-learning nlp

在通过定义主题来定义用于构建LDA模型的语料库和词典的同时,如何区分主题关键字

在给出明确的主题编号时它正在工作,但是我希望可以对其进行迭代。

准备字典和语料库

from gensim import corpora

dictionary = corpora.Dictionary(doc_clean)

corpus = [dictionary.doc2bow(doc) for doc in doc_clean]

构建LDA模型

lda_model = gensim.models.ldamodel.LdaModel(corpus = corpus , id2word=dictionary , num_topics=10 , random_state=100, update_every=1 , chunksize=100 , passes=10 , alpha='auto' , per_word_topics=True)

打印主题中的关键字

topics = print(lda_model.print_topic(6))

doc_lda = lda_model[corpus]

我想知道我们该如何迭代主题,而不是每次都手动给出主题编号

1 个答案:

答案 0 :(得分:0)

如果我正确理解了您的要求,那么您所需要的就是:

topics = []
num_topics=10
for i in range((num_topics)):
    topics.append(lda_model.print_topic(i+1))