使用iText从pdf文件中提取文本

时间:2016-10-12 23:58:38

标签: java pdf itext

import PdfReader;
import PdfTextExtractor;

PdfReader reader = new PdfReader(data.getBinaryStream());                       
PdfTextExtractor pdfTE=null;

try{
      pdfTE = new PdfTextExtractor(reader);
      noOfPages=reader.getNumberOfPages();                              
      int page = 1;
      System.out.println("output2:" + pdfTE.getTextFromPage(page));
}
catch (Exception ex) { 
      raiseError("Cannot read pdf file");
}

我想从pdf文件中获取文本但有时它可以正常工作,有时我会收到错误Cannot read pdf file。没有图像等..只是简单的文字。我使用较旧的iText版本(2.1.4)。

0 个答案:

没有答案