在另一个文件中查找一个文件的内容

时间:2013-02-25 02:59:53

标签: linux shell unix awk grep

我正在使用以下shell脚本将一个文件的内容查找到另一个文件中:

#!/bin/ksh
file="/home/nimish/contents.txt"

while read -r line; do
    grep $line /home/nimish/another_file.csv
done < "$file"

我正在执行脚本,但它没有显示csv文件中的内容。我的contents.txt文件包含csv文件中存在的"08915673""123223"等数字。我做错了吗?

3 个答案:

答案 0 :(得分:30)

grep本身就可以这样做。只需使用标记-f

grep -f <patterns> <file>

<patterns>是一个文件,每行包含一个模式;并且<file>是您要在其中搜索内容的文件。

请注意,要强制grep将每一行视为模式,即使每行的内容看起来像正则表达式,也应使用标记-F, --fixed-strings

grep -F -f <patterns> <file>

如果您的文件是CSV,如您所说,您可以这样做:

grep -f <(tr ',' '\n' < data.csv) <file>

例如,考虑文件“a.txt”,其中包含以下行:

alpha
0891234
beta

现在,文件“b.txt”,其中包含以下行:

Alpha
0808080
0891234
bEtA

以下命令的输出为:

grep -f "a.txt" "b.txt"
0891234

你根本不需要for - 在这里循环; grep本身就提供此功能。


现在使用您的文件名:

#!/bin/bash
patterns="/home/nimish/contents.txt"
search="/home/nimish/another_file.csv"
grep -f <(tr ',' '\n' < "${patterns}") "${search}"

您可以将','更改为文件中的分隔符。

答案 1 :(得分:2)

另一种解决方案:

  • 使用awk,创建您自己的hash(例如ahash),全部由您自己控制。
  • 替换$0 to $i,您可以匹配您想要的任何字段。

awk -F"," '
{  
   if (nowfile==""){ nowfile = FILENAME;  }

   if(FILENAME == nowfile)
   {
     hash[$0]=$0;
   }
   else
   {
       if($0 ~ hash[$0])
       {  
           print $0
       }
   }
} '  xx yy

答案 2 :(得分:1)

我认为你真的不需要一个脚本来执行你想要做的事情。

一个命令就足够了。在我的情况下,需要在csv文件的第11列中使用标识号(“;”作为分隔符)

grep -f <(awk -F";" '{print $11}' FILE_TO_EXTRACT_PATTERNS_FROM.csv) TARGET_FILE.csv 

我希望这会有所帮助。