我有一个我正在查询的数据集。数据如下所示:
db.activity.insert(
{
"_id" : ObjectId("5908e64e3b03ca372dc945d5"),
"startDate" : ISODate("2017-05-06T00:00:00Z"),
"details" : [
{
"code" : "2",
"_id" : ObjectId("5908ebf96ae5003a4471c9b2"),
"walkDistance" : "03",
"jogDistance" : "01",
"runDistance" : "08",
"sprintDistance" : "01"
}
]
}
)
db.activity.insert(
{
"_id" : ObjectId("58f79163bebac50d5b2ae760"),
"startDate" : ISODate("2017-05-07T00:00:00Z"),
"details" : [
{
"code" : "2",
"_id" : ObjectId("58f7948fbebac50d5b2ae7f2"),
"walkDistance" : "01",
"jogDistance" : "02",
"runDistance" : "09",
"sprintDistance" : ""
}
]
}
)
我想要的输出如下:
[
{
"_id": null,
"uniqueValues": [
"03",
"01",
"08",
"02",
"09"
]
}
]
为了做到这一点,我开发了以下代码:
db.activity.aggregate([
{
$facet: {
"walk": [
{$unwind: '$details'},
{$group: {_id: null, uniqueValues: {$addToSet: "$details.walkDistance"}}}
], "jog": [
{$unwind: '$details'},
{$group: {_id: null, uniqueValues: {$addToSet: "$details.jogDistance"}}}
], "run": [
{$unwind: '$details'},
{$group: {_id: null, uniqueValues: {$addToSet: "$details.runDistance"}}}
], "sprint": [
{$unwind: '$details'},
{$group: {_id: null, uniqueValues: {$addToSet: "$details.sprintDistance"}}}
]
}
}])
但是,我仍然使用自己的_id: null
和uniqueValues
数组获得4个不同的方面。如何更改查询以使它们全部包含在单个数组中,""
也被排除在外。
答案 0 :(得分:1)
$facet
在这里使用真的不是最好的。您应该真正应用$concatArrays
并使用$setDifference
和$filter
过滤结果:
db.activity.aggregate([
{ "$project": {
"_id": 0,
"unique": {
"$filter": {
"input": {
"$setDifference": [
{ "$concatArrays": [
"$details.walkDistance",
"$details.jogDistance",
"$details.runDistance",
"$details.sprintDistance"
]},
[]
]
},
"cond": { "$ne": [ "$$this", "" ] }
}
}
}},
{ "$unwind": "$unique" },
{ "$group": {
"_id": null,
"uniqueArray": { "$addToSet": "$unique" }
}}
])
返回结果:
/* 1 */
{
"_id" : null,
"uniqueArray" : [
"09",
"03",
"01",
"02",
"08"
]
}
因此,在使用$concatArrays
将所有数组值放入单个数组后,您应用$setDifference
将列表缩减为“唯一”值。 $filter
会删除您不想要的""
值。
然后,只需将$unwind
应用于单数和简化列表,并将$group
与$addToSet
一起重新组合,只保留文档中的唯一值。
您也可以只$concatArrays
,然后$unwind
和$match
,但其他运营商的成本并不高,并且已经缩小到“独特”,从而减少了部分负担“在你到达$unwind
之前的文件中。所以最好这样做。
真的,这甚至可以进一步细分,简单到$setUnion
和$setDifference
,因为我们之前讨论的是“集合”:
db.activity.aggregate([
{ "$project": {
"_id": 0,
"unique": {
"$setDifference": [
{ "$setUnion": [
"$details.walkDistance",
"$details.jogDistance",
"$details.runDistance",
"$details.sprintDistance"
]},
[""]
]
}
}},
{ "$unwind": "$unique" },
{ "$group": {
"_id": null,
"uniqueArray": { "$addToSet": "$unique" }
}}
])
这意味着整个语句与MongoDB 2.6兼容,或者如果$details.walkDistance
之类的所有表单都使用$map
以更长的形式写出:
"$setDifference": [
{ "$setUnion": [
{ "$map": { "input": "$details", "as": "d", "in": "$$d.walkDistance" } },
{ "$map": { "input": "$details", "as": "d", "in": "$$d.jogDistance" } },
{ "$map": { "input": "$details", "as": "d", "in": "$$d.runDistance" } },
{ "$map": { "input": "$details", "as": "d", "in": "$$d.sprintDistance" } }
]},
[""]
]
另一方面,运行$facet
会导致“强力”解析整个集合中的每个属性,并在每个传递中处理$unwind
。因此,获得结果是一种非常低效的方法。所以不要这样做。