anagram的弹性搜索索引?

时间:2017-07-18 10:49:52

标签: elasticsearch lucene

说我有句This is a new city

  1. 弹性搜索是否为单词的所有可能排列/组合创建索引。例如,对于单词“city”,它会创建索引“it”,“ty”,“ity”,“cit”等吗?
  2. 这些索引是在文档存储时还是在运行时创建的?
  3. 这些索引是保存在内存还是DB中?

1 个答案:

答案 0 :(得分:0)

  1. 这取决于您的tokenizer。默认情况下,Elasticsearch使用Standant Tokenizer divides text into terms on word boundaries, as defined by the Unicode Text Segmentation algorithm.这意味着您的句子将被标记为this, is, a, new, city。如果您愿意,可以创建自定义标记生成器。

  2. 将文档放入Elasticsearch时会对文档编制索引。

  3. 数据保存在文件系统中:https://www.elastic.co/blog/found-dive-into-elasticsearch-storage

  4. 以下是关于内部的博文:https://www.elastic.co/blog/found-elasticsearch-from-the-bottom-up