结合数组中的唯一项

时间:2017-08-21 22:39:48

标签: mongodb mongodb-query aggregation-framework

我有一个我正在查询的数据集。数据如下所示:

db.activity.insert(
    {
        "_id" : ObjectId("5908e64e3b03ca372dc945d5"),
        "startDate" : ISODate("2017-05-06T00:00:00Z"),
        "details" : [
            {
                "code" : "2",
                "_id" : ObjectId("5908ebf96ae5003a4471c9b2"),
                "walkDistance" : "03",
                "jogDistance" : "01",
                "runDistance" : "08",
                "sprintDistance" : "01"
            }
        ]
    }
)

db.activity.insert(
    {
        "_id" : ObjectId("58f79163bebac50d5b2ae760"),
        "startDate" : ISODate("2017-05-07T00:00:00Z"),
        "details" : [
            {
                "code" : "2",
                "_id" : ObjectId("58f7948fbebac50d5b2ae7f2"),
                "walkDistance" : "01",
                "jogDistance" : "02",
                "runDistance" : "09",
                "sprintDistance" : ""
            }
        ]
    }
)

我想要的输出如下:

[
  {
    "_id": null,
    "uniqueValues": [
      "03",
      "01",
      "08",
      "02",
      "09"
    ]
  }
]

为了做到这一点,我开发了以下代码:

db.activity.aggregate([
    {
        $facet: {
            "walk": [
                {$unwind: '$details'},
                {$group: {_id: null, uniqueValues: {$addToSet: "$details.walkDistance"}}}
            ], "jog": [
                {$unwind: '$details'},
                {$group: {_id: null, uniqueValues: {$addToSet: "$details.jogDistance"}}}
            ], "run": [
                {$unwind: '$details'},
                {$group: {_id: null, uniqueValues: {$addToSet: "$details.runDistance"}}}
            ], "sprint": [
                {$unwind: '$details'},
                {$group: {_id: null, uniqueValues: {$addToSet: "$details.sprintDistance"}}}
            ]
        }
    }])

但是,我仍然使用自己的_id: nulluniqueValues数组获得4个不同的方面。如何更改查询以使它们全部包含在单个数组中,""也被排除在外。

1 个答案:

答案 0 :(得分:1)

$facet在这里使用真的不是最好的。您应该真正应用$concatArrays并使用$setDifference$filter过滤结果:

db.activity.aggregate([
  { "$project": {
    "_id": 0,
    "unique": {
      "$filter": {
        "input": {
          "$setDifference": [
            { "$concatArrays": [ 
              "$details.walkDistance",
              "$details.jogDistance",
              "$details.runDistance",
              "$details.sprintDistance"
            ]},
            []
          ]
        },
        "cond": { "$ne": [ "$$this", "" ] }
      }
    }
  }},
  { "$unwind": "$unique" },
  { "$group": {
    "_id": null,
    "uniqueArray": { "$addToSet": "$unique" }  
  }}
])

返回结果:

/* 1 */
{
    "_id" : null,
    "uniqueArray" : [ 
        "09", 
        "03", 
        "01", 
        "02", 
        "08"
    ]
}

因此,在使用$concatArrays将所有数组值放入单个数组后,您应用$setDifference将列表缩减为“唯一”值。 $filter会删除您不想要的""值。

然后,只需将$unwind应用于单数和简化列表,并将$group$addToSet一起重新组合,只保留文档中的唯一值。

您也可以只$concatArrays,然后$unwind$match,但其他运营商的成本并不高,并且已经缩小到“独特”,从而减少了部分负担“在你到达$unwind之前的文件中。所以最好这样做。

真的,这甚至可以进一步细分,简单到$setUnion$setDifference,因为我们之前讨论的是“集合”:

db.activity.aggregate([
  { "$project": {
    "_id": 0,
    "unique": {
      "$setDifference": [
        { "$setUnion": [ 
          "$details.walkDistance",
          "$details.jogDistance",
          "$details.runDistance",
          "$details.sprintDistance"
        ]},
        [""]
      ]
    }
  }},
  { "$unwind": "$unique" },
  { "$group": {
    "_id": null,
    "uniqueArray": { "$addToSet": "$unique" }  
  }}
])

这意味着整个语句与MongoDB 2.6兼容,或者如果$details.walkDistance之类的所有表单都使用$map以更长的形式写出:

  "$setDifference": [
    { "$setUnion": [ 
      { "$map": { "input": "$details", "as": "d", "in": "$$d.walkDistance" } },
      { "$map": { "input": "$details", "as": "d", "in": "$$d.jogDistance" } },
      { "$map": { "input": "$details", "as": "d", "in": "$$d.runDistance" } },
      { "$map": { "input": "$details", "as": "d", "in": "$$d.sprintDistance" } }
    ]},
    [""]
  ]

另一方面,运行$facet会导致“强力”解析整个集合中的每个属性,并在每个传递中处理$unwind。因此,获得结果是一种非常低效的方法。所以不要这样做。

相关问题