如何将WE8MSWIN1252中编码的数据转换为utf8以便在Python脚本中使用?

时间:2010-05-25 13:08:03

标签: python oracle utf-8

此数据来自Oracle数据库,并以编码'WE8MSWIN1252'的形式提取到flatfiles。

我想解析数据并做一些分析。我想查看文本字段,但不需要将结果发布到任何其他系统,因此如果某些字符没有完美转换,我就没有问题了。

我只是不希望我的解析失败并出现解码错误,如果我使用的话,这就是我得到的:

inputFile = codecs.open(dataFileName,“r”,“utf-8'”)

1 个答案:

答案 0 :(得分:2)

从最后几个字符开始,我猜这个编码就是世界其他地方所谓的windows-1252。所以试试:

inputFile = codecs.open(dataFileName, "r", "windows-1252")