Python清理CSV

时间:2020-11-04 06:09:50

标签: python

我在虚拟机上有一个csv文件。 csv文件本质上是来自此站点的数据:

https://data.cityofnewyork.us/Social-Services/311-Service-Requests-from-2010-to-Present/erm2-nwe9/data

由于某些字段中存在逗号,因此出现了问题,因此Python认为这是新的专栏。例如,“ X坐标”和“ Y坐标”字段是两列(在许多列中),在它们的行内有逗号。

我想清除此文件,以便Python认为数字中的逗号不是新列。

有没有不使用熊猫的方法吗?

Here is a screenshot of the CSV file

1 个答案:

答案 0 :(得分:2)

是的,有多种方法可以实现。

考虑到您的目标是使用没有逗号问题的数据,您实际上并不关心它是CSV还是其他格式。因此,我想到的第一件事是,您可以将数据下载为JSON或XML,这是两种可用的方法,然后从那里下载

enter image description here

如果这不是您的选择,并且您确实想要CSV,我将创建一个Python脚本,该脚本将用分号,空格或转义字符(例如\或双引号)替换表示新列的列(类似到使用R)here完成的操作。为此,您知道在发生问题的列之前和之后会有多少逗号。