将PDF文档转换为XML文件,最好使用ITextSharp

时间:2012-06-21 22:04:13

标签: c# xml pdf itext

我有一个PDF文档,我需要从中读取数据。我发现当我将所述PDF转换为XML文档时,我可以在那里读取方便的标签,所以我需要一种方法来代码,将我的文件转换为xml,所以我可以使用mapper文件读取数据内容到数据库。

1 个答案:

答案 0 :(得分:0)

使用PDFMiner

PDFMiner是一种从PDF文档中提取信息的工具。它包括一个PDF转换器,可以将PDF文件转换为其他文本格式(如XML / HTML)。

与其他PDF相关工具不同,它完全专注于获取和分析文本数据。 PDFMiner允许人们获取页面中文本的确切位置,以及字体或线条等其他信息。

它有一个可扩展的PDF解析器,可用于除文本分析之外的其他目的。

相关问题