Question

我正在使用以下shell脚本将一个文件的内容查找到另一个文件中：

#!/bin/ksh
file="/home/nimish/contents.txt"

while read -r line; do
    grep $line /home/nimish/another_file.csv
done < "$file"

我正在执行脚本，但它没有显示csv文件中的内容。我的contents.txt文件包含csv文件中存在的"08915673"或"123223"等数字。我做错了吗？

Answer 1

grep本身就可以这样做。只需使用标记-f：

grep -f <patterns> <file>

<patterns>是一个文件，每行包含一个模式;并且<file>是您要在其中搜索内容的文件。

请注意，要强制grep将每一行视为模式，即使每行的内容看起来像正则表达式，也应使用标记-F, --fixed-strings。

grep -F -f <patterns> <file>

如果您的文件是CSV，如您所说，您可以这样做：

grep -f <(tr ',' '\n' < data.csv) <file>

例如，考虑文件“a.txt”，其中包含以下行：

alpha
0891234
beta

现在，文件“b.txt”，其中包含以下行：

Alpha
0808080
0891234
bEtA

以下命令的输出为：

grep -f "a.txt" "b.txt"
0891234

你根本不需要for - 在这里循环; grep本身就提供此功能。

现在使用您的文件名：

#!/bin/bash
patterns="/home/nimish/contents.txt"
search="/home/nimish/another_file.csv"
grep -f <(tr ',' '\n' < "${patterns}") "${search}"

您可以将','更改为文件中的分隔符。

Answer 2

另一种解决方案：

使用awk，创建您自己的hash（例如ahash），全部由您自己控制。
替换$0 to $i，您可以匹配您想要的任何字段。

awk -F"," '
{  
   if (nowfile==""){ nowfile = FILENAME;  }

   if(FILENAME == nowfile)
   {
     hash[$0]=$0;
   }
   else
   {
       if($0 ~ hash[$0])
       {  
           print $0
       }
   }
} '  xx yy

Answer 3

我认为你真的不需要一个脚本来执行你想要做的事情。

一个命令就足够了。在我的情况下，需要在csv文件的第11列中使用标识号（“;”作为分隔符）

grep -f <(awk -F";" '{print $11}' FILE_TO_EXTRACT_PATTERNS_FROM.csv) TARGET_FILE.csv

我希望这会有所帮助。

在另一个文件中查找一个文件的内容

3 个答案: