python高级搜索库

时间:2013-03-31 00:13:38

标签: python full-text-search

我有大约80,000个文本文件,我希望能够对它们进行高级搜索。 假设我有两个关键字列表,我想返回包含第一个列表中至少一个关键字和第二个列表中至少一个关键字的所有文件。 是否已经存在可以执行此操作的库,如果存在,我不想重写它。

2 个答案:

答案 0 :(得分:4)

由于您需要多次搜索文档,因此您很可能希望索引文本文件以尽可能快地进行搜索。

自己实现合理的索引肯定是可能的,但快速搜索引导我:

查看文档。希望实现理想的行为是非常微不足道的。

答案 1 :(得分:0)

我只是觉得你想要使用MapReduce类型的处理进行搜索。它应该是非常可扩展的,Python应该有MapReduce包。