我想按内容阅读PDF文件内容

时间:2009-11-17 08:53:42

标签: c# .net vb.net file pdf

我想阅读一个包含大量文字,图片和表格的PDF文件。我希望逐页阅读整个文件内容,从上到下。

例如:

  • 页面顶部包含标题
  • 然后在左侧的内容和右侧的图像

所以我首先要获得标题然后是内容然后是图像。

是否有任何开源用于阅读PDF或 .net 2.0或更高版本的任何编码参考?

修改

您好Konamiman,我使用iTextSharp但无法阅读文档。为了澄清,这是我在iTextSharp

的情况下使用的代码
iTextSharp.text.pdf.PdfReader documentReader = new PdfReader(@"C:\Documents and Settings\admin\My Documents\Visual Studio 2008\Projects\pdfClownPDFReader\pdfClownPDFReader\Hongkong Buffet.pdf");
            //MessageBox.Show(documentReader.NumberOfPages.ToString());
            PdfStamper PDFS = new PdfStamper(documentReader, m);
            PdfDictionary dictonary = documentReader.GetPageN(1);
            PdfObject obj = dictonary.Get(PdfName.TEXT);

我也试过PDFSharp。

1 个答案:

答案 0 :(得分:1)

例如iTextSharp