如何查看pdf上的页面是否包含特定文本

时间:2013-04-26 16:49:56

标签: php pdf pdf-generation

我想以编程方式查找PDF中包含某个子字符串的所有页面,如果他们这样做,那么我想用另一个PDF替换该页面。替换该页面不是问题 - 我可以使用PHP的pdflib绑定或pdftk来实现。我不知道怎么做是如何测试页面是否包含某个文本。

有什么想法吗?

1 个答案:

答案 0 :(得分:1)

我认为您最好的选择是将pdf分为单页,然后使用xpdf的pdftotext命令将内容转换为文本,然后使用PHP或grep搜索生成的文本。