Question

我正尝试将每页大的PDF文件从5000页拆分为6000页。PDF文件有7000页的文本和图像，大小为250MB。我编写的python代码适用于较小的PDF文件。

我收到以下错误：第一个错误是RecursionError: maximum recursion depth exceeded。

设置sys.setrecursionlimit(9999)后，出现以下错误Process finished with exit code -1073741571 (0xC00000FD)。 PDF文件已写入我的输出文件夹，但已损坏，大小为0kb。增加递归限制也无济于事。

我该怎么办？压缩PDF文件然后拆分？

这是我的代码：

pdf_file = open(path,'rb')
    pdf_reader = PdfFileReader(pdf_file)
    pageNumbers = pdf_reader.getNumPages()

    output = PdfFileWriter()

    #this is just to test if it works for 1 page
    output.addPage(pdf_reader.getPage(5854))

    with open("output_path" + "document-output.pdf", "wb") as f:
        output.write(f)

Answer 1

分享对我有用的东西。我已使用软件包wand来拆分此7000页的PDF文件。 wand package

from wand.image import Image
# Converting #page into JPG
with Image(filename="C:/Users/Name/Documents/PDFfile.pdf[5950]", resolution= 300) as img:
     img.save(filename="C:/Users/Name/Documents/temp1.jpg")

使用python将大型PDF文件拆分为单个PDF

1 个答案: