删除Df的第一行和第三行,同时保留第二行作为标题

时间:2018-11-21 14:57:30

标签: python pandas csv

今天开始学习这些东西,请原谅我的无知。

我的数据在csv中,如标题中所述,我想排除第一行和第三行,同时将第二行保留为标题。 csv看起来像这样:

"Title"
Date, time, count, hours, average
"empty row"

数据集从空行之后的行开始。

2 个答案:

答案 0 :(得分:3)

使用pd.read_csvskiprows参数:

from io import StringIO

x = StringIO("""Title
Date, time, count, hours, average

2018-01-01, 15:23, 16, 10, 5.5
2018-01-02, 16:33, 20, 5, 12.25
""")

# replace x with 'file.csv'
df = pd.read_csv(x, skiprows=[0, 2])

print(df)

         Date    time   count   hours   average
0  2018-01-01   15:23      16      10      5.50
1  2018-01-02   16:33      20       5     12.25

事实上,skiprows=[0]就足够了,因为默认情况下排除空行,​​即默认行为是skip_blank_lines=True

答案 1 :(得分:0)

使用read_csv中的参数header=1仅将第二行读入列,因为默认情况下排除空行:

import pandas as pd

temp=u"""Title
Date,time,count,hours,average

2015-01-01,25:02:10,10,20,15"""
#after testing replace 'pd.compat.StringIO(temp)' to 'filename.csv'
df = pd.read_csv(pd.compat.StringIO(temp), header=1)

print (df)
         Date      time  count  hours  average
0  2015-01-01  25:02:10     10     20       15