使用另一个字段的值更新MongoDB字段

时间:2010-10-20 05:22:01

标签: mongodb mongodb-query aggregation-framework

在MongoDB中,是否可以使用其他字段中的值更新字段的值?等效的SQL类似于:

UPDATE Person SET Name = FirstName + ' ' + LastName

MongoDB伪代码将是:

db.person.update( {}, { $set : { name : firstName + ' ' + lastName } );

11 个答案:

答案 0 :(得分:232)

你应该迭代。对于您的具体情况:

db.person.find().snapshot().forEach(
    function (elem) {
        db.person.update(
            {
                _id: elem._id
            },
            {
                $set: {
                    name: elem.firstname + ' ' + elem.lastname
                }
            }
        );
    }
);

答案 1 :(得分:144)

执行此操作的最佳方法是使用聚合框架来计算新字段。

MongoDB 3.4 +

最有效的解决方案是在版本4.2中使用3.4+中的$set$addFields以及$out聚合管道运算符。

我将在此处显示$addFields,因为$set$addFields的别名

db.collection.aggregate(
    [
        { "$addFields": { 
            "name": { "$concat": [ "$firstName", " ", "$lastName" ] } 
        }},
        { "$out": "collection" }
    ]
)

请注意,此不会更新您的收藏,而是替换现有收藏或创建新收藏。此外,对于需要“类型转换”的更新操作,您需要进行客户端处理, ,根据操作的不同,您可能需要使用find()方法而不是.aggreate()方法。

MongoDB 3.2和3.0

我们这样做的方法是$project我们的文档并使用$concat字符串聚合运算符来返回连接字符串。 我们从那里开始迭代游标并使用$set更新运算符使用批量操作将新字段添加到您的文档中,以实现最高效率。

聚合查询:

var cursor = db.collection.aggregate([ 
    { "$project":  { 
        "name": { "$concat": [ "$firstName", " ", "$lastName" ] } 
    }}
])

MongoDB 3.2或更新版

由此,您需要使用bulkWrite方法。

var requests = [];
cursor.forEach(document => { 
    requests.push( { 
        'updateOne': {
            'filter': { '_id': document._id },
            'update': { '$set': { 'name': document.name } }
        }
    });
    if (requests.length === 500) {
        //Execute per 500 operations and re-init
        db.collection.bulkWrite(requests);
        requests = [];
    }
});

if(requests.length > 0) {
     db.collection.bulkWrite(requests);
}

MongoDB 2.6和3.0

在此版本中,您需要使用现已弃用的Bulk API及其associated methods

var bulk = db.collection.initializeUnorderedBulkOp();
var count = 0;

cursor.snapshot().forEach(function(document) { 
    bulk.find({ '_id': document._id }).updateOne( {
        '$set': { 'name': document.name }
    });
    count++;
    if(count%500 === 0) {
        // Excecute per 500 operations and re-init
        bulk.execute();
        bulk = db.collection.initializeUnorderedBulkOp();
    }
})

// clean up queues
if(count > 0) {
    bulk.execute();
}

MongoDB 2.4

cursor["result"].forEach(function(document) {
    db.collection.update(
        { "_id": document._id }, 
        { "$set": { "name": document.name } }
    );
})

答案 2 :(得分:103)

显然,自MongoDB 3.4以来,有一种方法可以有效地完成这项工作,请参阅styvane's answer


下面的过时答案

您无法在更新中引用文档本身。您需要遍历文档并使用函数更新每个文档。有关示例,请参阅this answer,服务器端eval()请参见this one

答案 3 :(得分:41)

对于活动量较大的数据库,您可能会遇到更新影响主动更改记录的问题,因此我建议使用 snapshot()

db.person.find().snapshot().forEach( function (hombre) {
    hombre.name = hombre.firstName + ' ' + hombre.lastName; 
    db.person.save(hombre); 
});

http://docs.mongodb.org/manual/reference/method/cursor.snapshot/

答案 4 :(得分:9)

我尝试了上述解决方案,但我发现它不适合大量数据。然后我发现了流功能:

MongoClient.connect("...", function(err, db){
    var c = db.collection('yourCollection');
    var s = c.find({/* your query */}).stream();
    s.on('data', function(doc){
        c.update({_id: doc._id}, {$set: {name : doc.firstName + ' ' + doc.lastName}}, function(err, result) { /* result == true? */} }
    });
    s.on('end', function(){
        // stream can end before all your updates do if you have a lot
    })
})

答案 5 :(得分:3)

关于此answer,根据此update,快照功能在版本3.6中已弃用。因此,在3.6及更高版本上,可以通过以下方式执行操作:

db.person.find().forEach(
    function (elem) {
        db.person.update(
            {
                _id: elem._id
            },
            {
                $set: {
                    name: elem.firstname + ' ' + elem.lastname
                }
            }
        );
    }
);

答案 6 :(得分:2)

这里是我们想出的将一个字段复制到另一个字段~150_000条记录的内容。花了大约6分钟,但仍然比实例化和迭代相同数量的ruby对象的资源密集程度要小得多。

js_query = %({
  $or : [
    {
      'settings.mobile_notifications' : { $exists : false },
      'settings.mobile_admin_notifications' : { $exists : false }
    }
  ]
})

js_for_each = %(function(user) {
  if (!user.settings.hasOwnProperty('mobile_notifications')) {
    user.settings.mobile_notifications = user.settings.email_notifications;
  }
  if (!user.settings.hasOwnProperty('mobile_admin_notifications')) {
    user.settings.mobile_admin_notifications = user.settings.email_admin_notifications;
  }
  db.users.save(user);
})

js = "db.users.find(#{js_query}).forEach(#{js_for_each});"
Mongoid::Sessions.default.command('$eval' => js)

答案 7 :(得分:1)

使用 MongoDB 4.2+版,更新更加灵活,因为它允许在其updateupdateOneupdateMany中使用聚合管道。现在,您可以使用聚合运算符来转换文档,然后进行更新,而无需显式声明$set命令(而是使用$replaceRoot: {newRoot: "$$ROOT"}

在这里,我们使用聚合查询从MongoDB的ObjectID“ _id”字段中提取时间戳并更新文档(我不是SQL方面的专家,但我认为SQL不提供任何自动生成的带有时间戳的ObjectID,您将必须自动创建该日期)

var collection = "person"

agg_query = [
    {
        "$addFields" : {
            "_last_updated" : {
                "$toDate" : "$_id"
            }
        }
    },
    {
        $replaceRoot: {
            newRoot: "$$ROOT"
        } 
    }
]

db.getCollection(collection).updateMany({}, agg_query, {upsert: true})

答案 8 :(得分:0)

Mongo 4.2db.collection.update()开始可以接受聚合管道,最终允许基于另一个字段来更新/创建一个字段:

// { firstName: "Hello", lastName: "World" }
db.collection.update(
  {},
  [{ $set: { name: { $concat: [ "$firstName", " ", "$lastName" ] } } }],
  { multi: true }
)
// { "firstName" : "Hello", "lastName" : "World", "name" : "Hello World" }
  • 第一部分{}是匹配查询,用于过滤要更新的文档(在本例中为所有文档)。

  • 第二部分[{ $set: { name: { ... } }]是更新聚合管道(请注意方括号表示使用聚合管道)。 $set是新的聚合运算符,并且是$addFields的别名。

  • 不要忘记{ multi: true },否则只会更新第一个匹配的文档。

答案 9 :(得分:0)

(我本来可以将其发布为评论,但不能)

对于任何试图使用c#驱动程序在文档中使用另一个字段来更新一个字段的人来说... 我不知道如何使用任何UpdateXXX方法及其相关的重载,因为它们将UpdateDefinition作为参数。

// we want to set Prop1 to Prop2
class Foo { public string Prop1 { get; set; } public string Prop2 { get; set;} } 

void Test()
{ 
     var update = new UpdateDefinitionBuilder<Foo>();
     update.Set(x => x.Prop1, <new value; no way to get a hold of the object that I can find>)
}

作为一种解决方法,我发现您可以在RunCommandhttps://docs.mongodb.com/manual/reference/command/update/#dbcmd.update)上使用IMongoDatabase方法。

var command = new BsonDocument
        {
            { "update", "CollectionToUpdate" },
            { "updates", new BsonArray 
                 { 
                       new BsonDocument
                       {
                            // Any filter; here the check is if Prop1 does not exist
                            { "q", new BsonDocument{ ["Prop1"] = new BsonDocument("$exists", false) }}, 
                            // set it to the value of Prop2
                            { "u", new BsonArray { new BsonDocument { ["$set"] = new BsonDocument("Prop1", "$Prop2") }}},
                            { "multi", true }
                       }
                 }
            }
        };

 database.RunCommand<BsonDocument>(command);

答案 10 :(得分:0)

update() 方法将聚合管道作为参数,如

db.collection_name.update(
  {
    // Query
  },
  [
    // Aggregation pipeline
    { "$set": { "id": "$_id" } }
  ],
  {
    // Options
    "multi": true // false when a single doc has to be updated
  }
)

可以使用聚合管道使用现有值设置或取消设置字段。

注意:使用$和字段名来指定要读取的字段。

相关问题