使用gensim包加载.bin嵌入文件时出错

时间:2019-03-25 05:32:41

标签: python gensim word2vec

我尝试使用gensim加载.bin嵌入文件,但出现错误。我尝试了gensim提供的所有方法,但无法纠正错误

方法1

import gensim.models.keyedvectors as word2vec

model=word2vec.KeyedVectors.load_word2vec_format('Health_2.5reviews.s200.w10.n5.v10.cbow.bin', binary=True, unicode_errors=‘ignore')

方法2

from gensim.models import KeyedVectors

filename='Health_2.5reviews.s200.w10.n5.v10.cbow.bin'

model=KeyedVectors.load_word2vec_format(filename,binary=True,unicode_errors=‘ignore')

方法1和2给出了错误

  

“ UnicodeDecodeError:'utf-8'编解码器无法解码位置的字节0xbc   0:无效的起始字节”

方法3

from gensim.models import Word2Vec

filename='Health_2.5reviews.s200.w10.n5.v10.cbow.bin'

model=Word2Vec.load(filename)

方法3给出了错误

  

UnpicklingError:无效的加载密钥'\ xbc'。

0 个答案:

没有答案