BM25弹性搜索中的相似性

时间:2014-11-03 11:34:12

标签: elasticsearch

我想将Elasticsearch的默认相似性更改为BM25。

根据

http://www.elasticsearch.org/guide/en/elasticsearch/reference/1.4/index-modules-similarity.html

我只需将以下行添加到elasticsearch.yml文件

index.similarity.default.type: BM25

但是,BM25有两个我想设置的输入参数k1b

有谁知道如何设置这些参数?

2 个答案:

答案 0 :(得分:1)

在索引的设置中,输入相似性设置,就像你要映射一样

PUT /your_index/?pretty=1
{
       "settings": {
          "similarity": {
             "bm25-inverse-zero": {
                "type": "BM25",
                "b": 0
             }
          },
}

答案 1 :(得分:1)

我发现了一个非常好的页面,解释了参数的含义。它在这里:https://www.elastic.co/guide/en/elasticsearch/guide/current/pluggable-similarites.html

以下是该页面的摘录:

k1:此参数控制术语频率增加导致术语频率饱和的速度。默认值为1.2。值越低,饱和度越快,饱和度越低值越高。

b:此参数控制字段长度规范化应具有的效果。值0.0将完全禁用标准化,值1.0将完全标准化。默认值为0.75。

相关问题