使用PDF Box

时间:2017-12-04 16:09:07

标签: java spring-mvc parsing pdf pdfbox

我正在使用包含条形码的pdf。如图像Barcode which I am trying to read

所示

我遇到了问题,无法继续我的项目。我使用PDFBox解析PDF并能够以文本格式转换整个pdf,如下面的代码所示:

public static PdfValues readPdf() throws IOException {
        System.out.println("Main Method Started");
        File file = new File("D:/po/temp/output.pdf");
        PDDocument document = PDDocument.load(file);
        PDFTextStripper pdfStripper = new PDFTextStripper();
        String text = pdfStripper.getText(document);
        text = text.trim();
        text = text.replaceAll(" +", " ");
        text = text.replaceAll("(?m)^[ \t]*\r?\n", "");
        // System.out.println(text);
        deleteIfExist();
        writeToFile(text);
        PdfValues infos = readData();
        document.close();
        System.out.println("Main Method Ended");
        return infos;
    }

但我没有得到条形码值,这意味着它不是文本。任何人都可以帮我如何解析这个条形码值作为图像或实际值?感谢您阅读此问题。

0 个答案:

没有答案