根据命令行中的列拆分csv文件

时间:2018-05-24 19:44:33

标签: shell awk command-line scripting

我在csv形式的文件中有一些数据:

ID,DATE,EARNING
1,12 May 2018,5
1,13 May 2018,15
2,12 May 2018,25

我想将其拆分为多个文件,使file_1_May_report包含:

ID,DATE,EARNING
1,12 May 2018,5
1,13 May 2018,15

和另一个文件file_2_May_report包含:

ID,DATE,EARNING
2,12 May 2018,25

我试过了:

awk -F, '{print >> $1}' input.csv 

但是我只得到一个只有一条记录的文件1,这是输入文件中的最后一条记录。如何根据ID将其拆分为多个文件?

1 个答案:

答案 0 :(得分:1)

您可以使用此awk

awk -F, 'NR==1{hdr=$0; next} !seen[$1]++{fn="file_" $1 "_May_report"; print hdr > fn} {print > fn}' input.csv

或者使用更易读的格式:

awk -F, 'NR == 1 {
   hdr = $0
   next
}
!seen[$1]++ {
   fn = "file_" $1 "_May_report"
   print hdr > fn
}
{
   print > fn
}' input.csv