将任何版本的PDF转换为扫描/展平的PDF文件的最佳方法

时间:2019-02-26 12:35:05

标签: php fpdf ghostscript

我想知道有没有一种方法可以帮助我将未扫描的PDF(可以在Acrobat Pro中进行修改)转换为可以扫描/展平(不能在Acrobat Pro中进行编辑)的文件。

我一直在使用FPDF库,但似乎无法识别PDF是否变平/不在第一位,并因此触发了一些其他操作。

我已尽力研究FPDF库,我认为它会检查“外部参照”位置并决定采取哪些步骤。 但就我而言,我有2个文件,一个是扁平文件,一个不是,FPDF无法确定差异本身。这两个文件的版本均为1.4。我还读到FPDF只能处理1.4版本的pdf文件。

1 个答案:

答案 0 :(得分:0)

您可以使用Ghostscript的pdfimage设备将整个内容呈现为图像,然后将其包装为PDF文件。如果不通过OCR软件运行,绝对不可能从中提取任何内容。尽管很难确定,但是“声音是您想要的”。

恐怕我认为您对“扁平化”的理解是不正确的。所有PDF文件都会有一个外部参照,因此是否存在这样的关键字不会告诉您PDF是否已“展平”,无论您的用户/经理用那个相当模糊的术语表示什么。

缺少“外部参照”可能意味着该文件是PDF 1.5或更高版本,并且正在使用压缩的外部参照。与它的扁平化无关,但是任何PDF使用者都必须将此类文件与PDF 1.4或更低版本的文件区别对待。

相关问题