从PDF表单中提取PDF表单字段及其文本描述

时间:2019-08-12 13:12:12

标签: java python node.js pdf

我希望从PDF文档中提取表单字段及其文本描述。

当前,我能够使用XFDF签名提取字段的ID和名称。 我还可以提取PDF表单的完整文本。

但是,我需要的是字段描述与字段本身之间的某种映射(例如“ fieldId”:“ field_description”)。

在下面的示例中,红色标记的文本“ Family Name”将是描述,蓝色标记的字段将是相应的字段。

Example of what I mean by description and field

使用pdftk等当前工具是否有可能? 是否有任何命令行工具可以实现此映射,或者我该如何以其他方式实现?

0 个答案:

没有答案
相关问题