正则表达式搜索csv文件,

时间:2014-03-20 15:57:09

标签: regex

我有很多任务要做,从格式化的.csv文件中分离电压数据。

13/03/2014 18:48,71.556671,71.651062,71.639755,72.130692,71.961441,72.646423,72.262756,72.334511,7.812012

我是RegExpressions的新手,我如何反复从第10列获取数据? 我有超过10,000,000个文件要减少,平均为32,000个exel to graph。任何建议都非常欢迎,尝试使用PowerGrep来加快速度。

1 个答案:

答案 0 :(得分:0)

并非我会说正则表达式是 工具,但是这里有:

(?:[^,]*,){9}([^,]*)

即。九个"列"用逗号分隔的非逗号,然后捕获第1组中的第十个。

E.g。使用它与Perl单线:

perl -ne 'chomp; /(?:[^,]*,){9}([^,]*)/ and print "$1\n"'