python simhash不适用于ubuntu

时间:2014-04-21 20:07:09

标签: python ubuntu simhash

我在mac上使用相同的设置和代码来运行simhash,它可以工作。

但是当我在Ubuntu上运行时,它抱怨simhash本身的实现有错误。

你遇到过这样的问题吗?

objs = [(str(k),Simhash(v))for k,v in index_data.items()]   文件“/usr/local/lib/python2.7/dist-packages/simhash-1.1.2-py2.7.egg/simhash/init.py”,第30行,初始化     self.build_by_text(UNICODE(值)) UnicodeDecodeError:'ascii'编解码器无法解码位置34的字节0xf6:序数不在范围内(128)

1 个答案:

答案 0 :(得分:0)

错误告诉您,str(k)无法正确解码。由于我不知道数据的来源和实际情况,我只能说像

这样的东西
str(k).decode('cp850')


Simhash(v.decode('cp850'))

可能有所帮助。假设字符串在cp850中。至少我可以做'\xf6'.decode('cp850')

由于这似乎是模块中的问题,请检查所使用的字符串是否已事先正确解码。

相关问题