需要帮助清理从CSV文件导入的数据

时间:2012-12-07 09:02:01

标签: csv

我在CSV文件中有一个数据集,其中所有数据都包含在引号(“)中。例如:

"10/10/2008,""15:48:09"",""760.40"","" -N-       NONE"""
"10/10/2008,""16:00:00"",""754.66"","" -N-       NONE"""
"10/10/2008,""16:15:00"",""761.83"","" -N-       NONE"""
"10/10/2008,""16:30:00"",""758.24"","" -N-       NONE"""

我已导入csv文件,但结果仍包含数据框中的引号。例如:

0 "10/10/2008   "16:00:00""  "754.66""  " -N-   NONE""""

我需要一种从CSV导入此数据的新方法,或者从数据中删除多余引号的方法。

这是我导入数据的方式:

NAME = pd.read_table('FileName.csv', sep=',"')

我试图使用我在本网站上发现的一些想法来删除引文,但是我得到的错误是我无法解读的。仅供参考,如果你不知道,我对此非常陌生。非常感谢任何帮助。

2 个答案:

答案 0 :(得分:1)

这是格式错误的CSV,您必须在尝试使用它之前修复它。首先,您需要删除前导和尾随双引号,然后将2 x双引号替换为单引号。

喜欢这个......

10/10/2008,"15:48:09","760.40"," -N-       NONE"
10/10/2008,"16:00:00","754.66"," -N-       NONE"
10/10/2008,"16:15:00","761.83"," -N-       NONE"
10/10/2008,"16:30:00","758.24"," -N-       NONE"

答案 1 :(得分:0)

您可以再次尝试删除引号。然后导入它使用','作为唯一的分隔符: NAME = pd.read_table('FileName.csv',sep =',')