需要在C#中的数千个文档(.doc,.docx,.pdf)中搜索社会安全号码

时间:2010-12-30 09:13:56

标签: c# regex ms-word

这是访问文档(打开和只读文本)的最佳方式,以便更快地进行搜索。我已经尝试使用Microsoft office word对象打开并通过创建单词应用程序并打开文件来获取文本。我甚至不能使用线程,因为我需要创建一个单词应用程序,它不会帮助我进行线程化,如果我在每个线程中创建单词应用程序,系统无法处理它。你怎么建议我去。

提前致谢

1 个答案:

答案 0 :(得分:0)

啊......回去阅读操作系统的文档。很长一段时间(即很多年),有一个索引和搜索系统,实际上很多东西都可以挂钩(如果你安装了适当的过滤器,可以从microsoft,adobe等下载)。

这会创建一个全文索引,然后有一个API可供搜索。重复搜索大量文档的效率更高。

相关问题