在pdf和ppts上运行弹性搜索

时间:2017-12-28 12:49:51

标签: elasticsearch apache-tika

我是弹性搜索新手。我已经阅读了它的教程。但需要就我的问题提供指导:

我的系统上有一系列pdf文档和power point文件。我需要使用弹性搜索构建一个系统,我可以根据此文件中的关键字检索这些文件。有人可以指导我如何在这里继续索引我的文档。我需要解析我的pdf并使用Tika或FSCrawler将其转换为JSON格式,然后将其提供给弹性搜索。

三江源。

1 个答案:

答案 0 :(得分:0)

您应该设置FSCrawler,它将进行解析并使文件内容可搜索。