是否可以将pdf转换为文本?

时间:2011-08-26 06:54:05

标签: android pdf

在我的应用程序中,我从网上下载pdf文件。在android中是否可以将该pdf文件转换为文本(字符串或字符)?

请给我你宝贵的建议。

4 个答案:

答案 0 :(得分:4)

实际上,可以将PDF转换为文本。比转换更好的术语是提取。

如果PDF仅包含图像,则只需要一个OCR工具。如果PDF是扫描文档的结果,则通常就是这种情况。但即便如此,扫描驱动程序通常会将文本作为不可见文本插入,以便可以搜索PDF内容。

答案 1 :(得分:0)

有些开源工具尝试这样做,尽管出于显而易见的原因,输出通常不够完美。

答案 2 :(得分:0)

结帐http://pdfbox.apache.org/。我没有使用它,也不知道它是否使用awt来处理pdf。由于android不支持awt plz检查awt用法。

答案 3 :(得分:-4)

Bruno Lowagie(iText开发人员)说不幸没有。

  

这很正常。这是PDF的“本质”。   PDF是一个单向过程。 PDF是最终产品。   您不应该将其转换为文本。

     

您需要一个OCR工具。

http://itext-general.2136553.n4.nabble.com/Convert-PDF-to-text-td2142916.html

关心Stefan