我在哪里可以找到50维度的word2vec格式的预训练单词嵌入(英语)?

时间:2017-02-28 05:54:13

标签: word2vec word-embedding pre-trained-model

最好它应该是txt文件而不是二进制文件。我发现所有经过预先训练的单词嵌入都有300多个维度。

谢谢

2 个答案:

答案 0 :(得分:0)

http://nlp.stanford.edu/data/glove.6B.zip 以GloVe格式下载此文件,并使用以下脚本将其转换为word2vec格式:https://github.com/jroakes/glove-to-word2vec

答案 1 :(得分:0)

可能的情况是,300维模型的任何50维仍然有用。因此,您可以想象在文本中使用300维集合,并修补文件以指定50维并丢弃每行的最后250个维度。