将CSV文件读入Dataframe时出现UnicodeDecodeError

时间:2015-08-10 21:40:20

标签: python csv pandas

我使用下面的代码将csv文件读入数据帧。但是,我收到了错误pandas.parser.CParserError: Error tokenizing data. C error: Expected 1 fields in line 4, saw 2,因此我按照建议herepd.read_csv('D:/TRYOUT.csv')更改为pd.read_csv('D:/TRYOUT.csv', error_bad_lines=False)。但是,我现在在同一行中得到错误UnicodeDecodeError: 'utf-8' codec can't decode byte 0xf0 in position 1: invalid continuation byte

def ExcelFileReader():
    mergedf = pd.read_csv('D:/TRYOUT.csv', error_bad_lines=False)
    return mergedf

谢谢

2 个答案:

答案 0 :(得分:1)

如果您使用的是Windows,则可能需要使用pd.read_csv(filename, encoding='latin-1')

答案 1 :(得分:0)

我有类似的问题,不得不使用

utf-8-sig 

作为编码,

我使用utf-8-sig的原因是因为如果你得到非拉丁字符,它将无法正确处理它。有几种方法可以解决这个问题,但我想你可以选择最适合你需求的方法。

希望有所帮助。