Question

给定./wordslist.txt文件<word> <number_of_apparitions>，例如：

aš toto 39626
ir 35938
tai 33361
tu 28520
kad 26213
...

如何排除行尾数字，以便收集output.txt个数据：

aš toto
ir
tai
tu
kad
...

注意： Sed，find，cut或grep首选。因为我的数据可以包含ascii字母，非ascii字母，中文字符，数字等，所以我不能使用保存[a-z]内容的东西。

Answer 1

我建议：

cut -d " " -f 1 wordslist.txt > output.txt

或者：

sed -E 's/ [0-9]+$//' wordslist.txt > output.txt.

Answer 2

在这种情况下，使用awk打印第一个单词。

awk '{print $1}' your_file > your_new_file

Answer 3

awk解决方案只需打印输入行，不包括上一栏

$ awk '{NF--; print}' wordslist.txt 
aš toto
ir
tai
tu
kad

注意：

Answer 4

以下作品：

sed  -r 's/ [0-9]+$//g' wordslist.txt