我训练了一个包含~5M 西班牙语文章的GloVe。我知道如何在gensim中加载这个GloVe并使用它就好像它是一个word2vec模型。 现在我面临着主题建模和从新闻文章中提取关键字的问题(也是西班牙语),所以我想知道如何使用训练有素的模型这样做。
我怎么能这样做?
答案 0 :(得分:1)
关于如何使用word2vec模型的问题很一般,所以我的答案也是如此。
word2vec允许你做的是提供一般的"更好的"单词的表示。所以,如果你正在使用"那些词语"作为主题建模中的一个功能,您可以使用"一词包矢量来替换它。来自word2vec,希望能给你更好的语义相似性。也许是更好的关键词。