我使用Elasticsearch为书籍编制索引,以便使用FTS搜索它们。其中一个要求是我必须显示包含命中数的页面数。
我最初计划在索引字符串中包含页面分隔符,然后在我搜索并在突出显示的单词之前计算页面分隔符时获取高亮显示。再想一想,我关心性能问题。有些书的大小可能达到500 KB。计算字符串中的单词,这些单词听起来像错误的主意。将匹配单词的偏移量与页面分隔符的偏移量进行比较会好得多。据我了解,with_positions_offsets
导致ES存储这些偏移量,所以理想情况下我希望能为我完成这项工作。
这可以在ES中完成吗?什么是寻找热门书籍的哪一页的替代解决方案?