Question

下面是获取完全匹配的查询

GET courses/_search
{
  "query": {
    "term" : {
         "name.keyword": "Anthropology 230"
      }
  }
}

我需要找到Anthropology 230和Anthropology 250 also

如何获得完全匹配

Answer 1

您所做的错误是您在关键字字段上使用了术语查询，并且没有对这两个查询都进行分析，这意味着他们试图在倒排索引中找到完全相同的搜索字符串。

您应该做的是：定义一个text字段，如果您尚未定义映射，则该字段将一直存在。我还假设与您提到的.keyword查询相同，如果您未定义映射，则会自动创建。

现在，您只需在下面进行分析的match query下使用并使用standard analyzer即可在空白处分割标记，因此Anthropology 250和230为您的2个示例文档生成的。

简单高效的查询，同时带来了两个文档

{
    "query": {
        "match" : {
            "name" : "Anthropology 230"
        }
    }
}

和搜索结果

 "hits": [
      {
        "_index": "matchterm",
        "_type": "_doc",
        "_id": "1",
        "_score": 0.8754687,
        "_source": {
          "name": "Anthropology 230"
        }
      },
      {
        "_index": "matchterm",
        "_type": "_doc",
        "_id": "2",
        "_score": 0.18232156,
        "_source": {
          "name": "Anthropology 250"
        }
      }
    ]

上述查询与两个文档匹配的原因是，它创建了两个令牌anthropology和230，并且在两个文档中都匹配了anthropology。

您绝对应该阅读analysis process的知识，也可以尝试analyze API查看为任何文本生成的标记。

分析文本的API输出

POST http：// {{hostname}}：{{port}} / {{index-name}} / _analyze

{
  "analyzer": "standard",
  "text": "Anthropology 250"
}


{
    "tokens": [
        {
            "token": "anthropology",
            "start_offset": 0,
            "end_offset": 12,
            "type": "<ALPHANUM>",
            "position": 0
        },
        {
            "token": "250",
            "start_offset": 13,
            "end_offset": 16,
            "type": "<NUM>",
            "position": 1
        }
    ]
}

Answer 2

您可以检查并尝试使用match，match_phrase或match_phrase_prefix

使用匹配，

GET courses/_search
{
    "query": {
        "match" : {
            "name" : "Anthropology 230"
        }
    },
    "_source": "name"
}

使用 match_phrase ，

GET courses/_search
{
    "query": {
        "match_phrase" : {
            "name" : "Anthropology"
        }
    },
    "_source": "name"
}

OR ，使用regexp，

GET courses/_search
{
    "query": {
        "regexp" : {
            "name" : "Anthropology [0-9]{3}"
        }
    },
    "_source": "name"
}

Answer 3

假设您可能有更多的“人类学nnn”项目，这应该可以满足您的需求：

"query":{
    "bool":{
        "must":[
            {"term": {"name.keyword":"Anthropology 230"}},
            {"term": {"name.keyword":"Anthropology 250"}},
        ]  
    }
}

如何获得多个完全匹配词组

3 个答案: