以pdf格式搜索文字

时间:2012-02-10 12:23:13

标签: c# pdf acrobat-sdk

有人可以告诉我,com引用中的AcrobatAccessLib(Acrobat Access 3.0类型库)是否可用于pdf文档中的文本搜索? 它包含类PDDom,但我不知道我是否可以将文档加载到其中,或者如何使用它。

(我不想使用iTextSharp,其他人,我尝试过但不能按照我想要的方式工作 - pdf已经损坏了数字分页+包含表格,这是2页 - iTextSharp找到我在两个页面上搜索文本 - 而不是1 ,但如果我使用Acrobat Reader - 效果很好)

编辑:或者另一个问题,我可以在我的应用程序中使用acrobat reader及其搜索模块吗?

我在c#

工作

非常感谢!

2 个答案:

答案 0 :(得分:1)

尝试使用PDFLIBNET.DLL

在那个dll中有pdfwrapper类,这个类提供了很多从pdf获取文本的方法。 FindText方法用于从特定位置获取文本,而exportToText方法提供pdf页面的内容

从该内容中,您将搜索pdf内容..

我正在使用tat DLL并在没有任何问题的情况下搜索pdf内容..

尝试并让我知道..

答案 1 :(得分:1)

如果钱不是问题,我会使用Aspose PDF组件。它们运行良好,专为服务器使用而构建。