Question

希望你能解释我的一个要求。假设我有以下条目的文件：

ABC 123
XYZ 789
XYZ 456
ABC 234
XYZ 789
ABC 567
XYZ 789
XYZ 678
XYZ 123

基本上，我有行ABC，其后面有X个XYZ行。每个ABC中XYZ记录的数量从1到多不等。

我需要一个shell脚本，它将根据第二列中的模式输出ABC和相应的XYZ。

例如，显示带有模式567的ABC记录和带有模式678的相应XYZ记录。

输出应该只是：

ABC 567
XYZ 678

Answer 1

尝试这个，如果它适合你。我希望我理解你的要求：

 awk -v p1='ABC 567' -v p2='XYZ 678' 
       '$0~p1{t=1;print;next}/^ABC/{t=0}$0~p2&&t' file

Answer 2

要解决此问题，我使用awk将数据按到一行，然后在该输出上按grep，然后sed将匹配的条目恢复为原始格式。

awk '{ printf ($1 == "ABC" ? "\n" : " @¶@ ") $0 }' file |grep 567 |sed 's/ @¶@ /\n/g'

代码漫步：

我使用@¶@作为分隔符。使用在您的数据中不会发生冲突的内容（否则您将不得不处理它的转义）。另请注意，您的UTF8支持里程可能会有所不同。
awk打印，没有尾随换行符，两个连接的东西：
- 如果我们在ABC线上，换行符（\n）。否则，分隔符（@¶@）。
- 然后是现有的行（$0）
grep运行您的查询。这使您可以使用-f FILE_OF_PATTERNS或-e PATTERN s
sed然后将分隔符恢复为原始格式

这有利于逐行进行。如果你在一个ABC中有成千上万的XYZ，它会慢一点，但这并不能保留在内存中，所以这应该是相当可扩展的。

以上是awk命令的输出（是的，有一个前导空白行，这并不重要）：

$ awk '{ printf ($1 == "ABC" ? "\n" : " @¶@ ") $0 }' file

ABC 123 @¶@ XYZ 789 @¶@ XYZ 456
ABC 234 @¶@ XYZ 789
ABC 567 @¶@ XYZ 789 @¶@ XYZ 678 @¶@ XYZ 123

使用多个图案显示多行

2 个答案: