使用PDFBox提取没有页眉和页脚的文本

时间:2012-09-10 16:45:27

标签: lucene pdfbox

我使用PDFTextStripper类在Lucene索引之前提取pdf文本。

是否有可能从提取的文本中排除pdf页眉和页脚?

1 个答案:

答案 0 :(得分:0)

如果您知道文档中页眉和页脚的确切位置,则可以按区域使用文本提取。希望这会有所帮助。

相关问题