Question

今天开始学习这些东西，请原谅我的无知。

我的数据在csv中，如标题中所述，我想排除第一行和第三行，同时将第二行保留为标题。 csv看起来像这样：

"Title"
Date, time, count, hours, average
"empty row"

数据集从空行之后的行开始。

Answer 1

使用pd.read_csv的skiprows参数：

from io import StringIO

x = StringIO("""Title
Date, time, count, hours, average

2018-01-01, 15:23, 16, 10, 5.5
2018-01-02, 16:33, 20, 5, 12.25
""")

# replace x with 'file.csv'
df = pd.read_csv(x, skiprows=[0, 2])

print(df)

         Date    time   count   hours   average
0  2018-01-01   15:23      16      10      5.50
1  2018-01-02   16:33      20       5     12.25

事实上，skiprows=[0]就足够了，因为默认情况下排除空行，即默认行为是skip_blank_lines=True。

Answer 2

使用read_csv中的参数header=1仅将第二行读入列，因为默认情况下排除空行：

import pandas as pd

temp=u"""Title
Date,time,count,hours,average

2015-01-01,25:02:10,10,20,15"""
#after testing replace 'pd.compat.StringIO(temp)' to 'filename.csv'
df = pd.read_csv(pd.compat.StringIO(temp), header=1)

print (df)
         Date      time  count  hours  average
0  2015-01-01  25:02:10     10     20       15

删除Df的第一行和第三行，同时保留第二行作为标题

2 个答案: