整个doc2vec模型中的单词向量与特定文档中的单词向量

时间:2019-05-01 16:37:26

标签: gensim word2vec doc2vec

我使用默认的word2vec训练(dm = 1)训练了gensim的Doc2Vec模型。我可以从model.wv.vectors中的全局模型中获取单词vector。 但是documentation说,根据出现的文档上下文,相同的单词(在示例中为“ leaves”)不会具有相同的向量。

所以我有点困惑:在model.wv.vectors中,示例中的“ leaves”一词对于用于训练模型的所有文档都具有相同的向量(这可能与我的理解相矛盾。从文档)?如果没有,如何从特定文档中获取单词向量?

1 个答案:

答案 0 :(得分:0)

该文档具有误导性。单词标记'leaves'在该模型中将只有一个单词向量。

我猜测该评论的作者可能意味着在PV-DM模式(dm=1)中进行模型训练期间,训练预测将受到组合的影响该文本的单词向量和“浮动”文档向量(以及上下文窗口中其他相邻的单词向量)的大小。但是,一个单词只有一个向量,那里的描述很混乱。

相关问题