从.PDF文件中提取数据

时间:2011-02-07 15:24:37

标签: c#

我需要从.PDF文件中提取数据并将其加载到SQL 2008.任何人都可以告诉我如何继续吗?

This is how the data looks

2 个答案:

答案 0 :(得分:2)

您需要使用iTextSharp等PDF库从PDF中提取数据。

此时,您拥有数据并可将其插入数据库。

答案 1 :(得分:0)

文本提取在iText中运行良好,直到您无需从列而不是行中提取文本(例如,当您从PDF文档中复制文本时,Adobe Reader和Foxit Reader都会这样做。要逐列提取文本,工具需要计算页面上文本的位置和坐标

商业工具ByteScout PDF Extractor SDK能够通过逐行和逐列模式进行文本提取(或者可以简单地将数据提取为结构化XML)

免责声明:我目前为ByteScout工作