如何根据列值将CSV文件拆分为多个文件

时间:2015-06-17 19:09:56

标签: bash csv awk

我有CSV文件,看起来像这样:

name1;1;11880
name2;1;260.483
name3;1;3355.82
name4;1;4179.48
name1;2;10740.4
name2;2;1868.69
name3;2;341.375
name4;2;4783.9

可能有更多或更少的行,我需要将其拆分为多个.dat文件,每个文件包含与此文件的第二列具有相同值的行。 (然后我将为每个.dat文件制作条形图)对于这种情况,它应该是两个文件:

data1.dat 
name1;1;11880
name2;1;260.483
name3;1;3355.82
name4;1;4179.48

data2.dat
name1;2;10740.4
name2;2;1868.69
name3;2;341.375
name4;2;4783.9

用bash做这件事有什么简单的方法吗?

2 个答案:

答案 0 :(得分:9)

您可以使用awk生成仅包含第二列特定值的文件:

awk -F ';' '($2==1){print}' data.dat > data1.dat

只需更改$2==条件中的值即可。

或者,如果您想自动执行此操作,请使用:

awk -F ';' '{print > ("data"$2".dat")}' data.dat

将输出到包含名称中第二列值的文件。

答案 1 :(得分:2)

试试这个:

while IFS=";" read -r a b c; do echo "$a;$b;$c" >> data${b}.dat; done <file