如何在Elasticsearch中提取.doc / .docx文件?

时间:2020-02-14 08:40:35

标签: elasticsearch elasticsearch-plugin data-ingestion elasticsearch-7 fscrawler

我正在尝试在我的Elasticsearch环境中索引Word文档。我尝试使用elasticsearch提取附件附件,但似乎只能提取base64编码的数据。

我的目标是使用Word文件索引整个目录。我尝试使用FSCrawler,但可悲的是目前它在索引Word文档时包含一个错误。如果有人可以向我解释一种索引包含Word文档的目录的方法,我将非常感激。

0 个答案:

没有答案
相关问题