计算大文件中的字符长度

时间:2019-04-08 16:15:36

标签: linux bash shell

我需要从一个包含140000行的文件中查找字符长度,每个字符串的长度都不同。

aaaaa
bbb
ccccc
ddddd
fff

预期输出如下

strings char-length
2       3
3       5

(表示2个字符串的字符长度为3,3个字符串的字符长度为5)。我已经尝试过for-loop,它可以读取每一行,但是由于我的文件有140000个字符串行,因此需要一些时间。

1 个答案:

答案 0 :(得分:0)

如果有可用的awk,则可以尝试以下命令:

awk '{ print length($0) }' <your_file> | sort | uniq -c

(在我的VM上使用27ms的示例测试文件,包含7000行,每行大约10个字符)。