用pandas读取rpt文件

时间:2017-12-06 23:28:40

标签: python pandas

我使用以下方法将rpt数据读取到pandas:

import pandas as pd
df = pd.read_fwf("2014-1.rpt", skiprows=[1], nrows=150)

我实际上是按照anwser here 但是,对于某些列,分离不准确。这是我得到的样本:

Country   Order Date Device   Category
UK        2014-01-03 Desktop  Shoes
IT        2014-01-03 Desktop  Shoes
FR        2014-01-04 Desktop  Dress
FR        2014-01-04 Tablet   Dress
US        2014-01-05 Desktop  Bags
US        2014-01-06 Desktop  Bags
UK        2014-01-07 Tablet   Dress

例如,它将Order Date和Device列作为单个列读取。实际上,这只是一个例子,有很多这样的列。 怎么解决?你有什么主意吗? 实际上这些有问题的列可能有固定的宽度

1 个答案:

答案 0 :(得分:3)

这个问题很老,但这是一个答案。您可以使用pandas将其作为csv读取。我已经将它用于各种rpt文件并且它已经有效了。

import pandas as pd
df = pd.read_csv("2014-1.rpt", skiprows=[1], nrows=150)
相关问题