搜索多个pdf文件的内容并返回pdf的文件名和匹配内容?

时间:2013-04-28 13:07:05

标签: bash unix pdf find pdftotext

我试过了:

PDF=$(find /"$DIRECTORY"/ -name '*.pdf' -exec pdftotext {} - \; | grep 'palindrom')

以这种方式echo "$PDF只打印.pdf文件中的一些文本,其中找到了我的单词“palindrom”,但我也想知道他找到单词的.pdf文件名。

/"$DIRECTORY"/中有许多文件夹,.pdf和.txt文件,所以我只需要返回文本转换与我的单词“palindrom”匹配的.pdf文件

由于

2 个答案:

答案 0 :(得分:0)

您可以尝试使用以下命令吗?而不是'bash'可能是'sh'可以帮助。

find "$DIRECTORY" -name \*.pdf | xargs -I {} bash -c 'echo {}; less {} | grep palindrom'

答案 1 :(得分:0)

find "$DIRECTORY" -name "*.pdf" -exec grep "palindrom" pdftotext“{}”\; -print会有效吗?

编辑:它不喜欢我的回复:pdftotext“{}”应该是`pdftotext“{}”`