我想在熊猫中读取以下文件“ test.csv”:
# TEXT 1
# TEXT 2
# STN,YYYYMMDD, HH, DD, FH, FF, FX
#
225,19900101, 1, 110, 36, 41, 46
225,19900101, 2, 90, 36, 36, 51
225,19900101, 3, 120, 31, 31, 46
在csv中,我想跳过所有以#开头的行,并且我想将第三行用作标题(列名),而标题中没有#字符。
起作用的是::
df = pd.read_csv(filename, header=2)
df = df.iloc[1:].reset_index(drop=True)
df.rename(columns={"# STN": "STN"},inplace=True)
哪个给:
STN YYYYMMDD HH DD FH FF FX
0 225 19900101.0 1.0 110.0 36.0 41.0 46
1 225 19900101.0 2.0 90.0 36.0 36.0 51
2 225 19900101.0 3.0 120.0 31.0 31.0 46
但是我想知道是否有一种方法可以从导入中跳过此#字符作为行,并获得不包含#字符的标头(因此我不必手动查找必须跳过的行以及在何处找到标题)?