Question

是否有与

相同的UNIX命令

sort | uniq

找到字符串集交叉点或“异常值”。

一个示例应用程序：我有一个html模板列表，其中一些有{％load i18n％}字符串在里面，有些则没有。我想知道哪些文件没有。

编辑： grep -L解决了上述问题。

这个怎么样：

文件1：

mom
dad
bob

file2的：

dad

％与file1 file2相交

dad

％left-unique file1 file2

mom
bob

Answer 1

似乎grep -L解决了海报的真正问题，但对于实际问题，找到两组字符串的交集，您可能需要查看“comm”命令。例如，如果file1和file2每个都包含一个排序的单词列表，每行一个单词，那么

$ comm -12 file1 file2

将生成两个文件共有的单词。更一般地，给定排序的输入文件file1和file2，命令

$ comm file1 file2

生成三列输出

您可以使用N选项取消输出中的列-N。因此，上面的命令comm -12 file1 file2会抑制第1列和第2列，只留下两个文件共有的字。

Answer 2

相交：

# sort file1 file2 | uniq -d
dad

左边唯一：

# sort file1 file2 | uniq -u
bob
mom

Answer 3

也许我误解了这个问题，但为什么不使用grep来查找字符串（使用-L选项让它打印出没有字符串的文件的名称）。

换句话说

grep -L "{% load i18n %}" file1 file2 file3 ... etc

或适当的文件名通配符。

Answer 4

两个（未排序的）文件之间的交叉：

grep -Fx -f file1 file2

file2中不在file1中的行：

grep -Fxv -f file1 file2

说明：

Answer 5

来自人grep

-L, --files-without-match

抑制正常输出;而是打印每个输入文件的名称通常没有输出打印。扫描将停止第一场比赛。

因此，如果您的模板是您想要的.html文件：

grep -L '{% load i18n %}' *.html

Answer 6

路口：

comm -12 <(cat file1 | sort | uniq) <(cat file2 | sort | uniq)

所有行按3列（file1 | file2 | intersection）：

comm <(cat file1 | sort | uniq) <(cat file2 | sort | uniq)

如果您的文件没有排序和/或某个文件中可能有重复的行但是没有出现在另一个文件中 - 这个单行命令会对您的文件进行排序，删除重复的行你将直接得到你想要的结果。