在python中的pdf中添加基于关键字的书签

时间:2019-03-18 15:45:05

标签: python pdf pypdf2

我正在尝试基于pdf文件中存在的关键字在pdf中创建书签。我可以使用pypdf2的addbookmark函数为pdf页面创建书签。但是它是基于页面的,而不是基于关键字的。 例如,如果pdf包含“元数据”作为单词,我想为“元数据”关键字创建书签。

我已经推荐了Add a bookmark to a PDF with PyPDF2,它可以为页面创建书签。

output = PdfFileWriter() # open output
input = PdfFileReader(open('test.pdf', 'rb')) # open input
output.addPage(input.getPage(0)) # insert page
output.addBookmark('Hello, World Bookmark', 0, parent=None) # add bookmark
outputStream = file('result.pdf','wb') #creating result pdf JCT
output.write(outputStream) #writing to result pdf JCT
outputStream.close() #closing result JCT

1 个答案:

答案 0 :(得分:0)

由于我认为没有特定类型的书签,也就是您所说的关键字书签,也许您的意思是在每个出现关键字的页面上添加一个书签。为此,您需要遍历页面,如果页面包含关键字,请在该页面上添加书签。