awk第二列中第二列的最大值

时间:2014-08-06 16:41:12

标签: linux sorting awk

我正在尝试仅为第一列中的日期打印第二列的最大值。

我的档案是:

2014-04-09,135303
2014-04-09,416400
2014-04-15,143684
2014-04-15,156011
2014-04-15,184406
2014-04-16,1123083
2014-04-16,167486
2014-04-16,862196
2014-04-17,963023
2014-04-19,583844

必需输出:

2014-04-09,416400
2014-04-15,184406
2014-04-16,1123083
2014-04-17,963023
2014-04-19,583844

我试过排序但没有工作:

cat file|sort -k2 -r | sort --unique --stable -k1

请建议如何使用awk或sort

完成

1 个答案:

答案 0 :(得分:1)

kent$  awk -F, '{a[$1]=$2>a[$1]?$2:a[$1]}END{for(x in a)print x "," a[x]}' file
2014-04-15,184406
2014-04-16,1123083
2014-04-17,963023
2014-04-09,416400
2014-04-19,583844

如果您希望按日期排序结果,请将上面的行传递给sort

awk -F, '{a[$1]=$2>a[$1]?$2:a[$1]}END{for(x in a)print x "," a[x]}' f|sort 
2014-04-09,416400
2014-04-15,184406
2014-04-16,1123083
2014-04-17,963023
2014-04-19,583844