Question

我使用下面的代码将csv文件读入数据帧。但是，我收到了错误pandas.parser.CParserError: Error tokenizing data. C error: Expected 1 fields in line 4, saw 2，因此我按照建议here将pd.read_csv('D:/TRYOUT.csv')更改为pd.read_csv('D:/TRYOUT.csv', error_bad_lines=False)。但是，我现在在同一行中得到错误UnicodeDecodeError: 'utf-8' codec can't decode byte 0xf0 in position 1: invalid continuation byte。

def ExcelFileReader():
    mergedf = pd.read_csv('D:/TRYOUT.csv', error_bad_lines=False)
    return mergedf

谢谢

Answer 1

如果您使用的是Windows，则可能需要使用pd.read_csv(filename, encoding='latin-1')

Answer 2

我有类似的问题，不得不使用

utf-8-sig

作为编码，

我使用utf-8-sig的原因是因为如果你得到非拉丁字符，它将无法正确处理它。有几种方法可以解决这个问题，但我想你可以选择最适合你需求的方法。

希望有所帮助。

将CSV文件读入Dataframe时出现UnicodeDecodeError

2 个答案: