合并两个对象数组的最有效方法

时间:2013-02-21 19:36:22

标签: javascript arrays performance algorithm merge

我已经解决了这个问题。但是我正在寻找更快的解决方案,因为我的变量有数千个对象。

我有两个这样的数组:

var full = [{a:'aa1',b:'bb1'},{a:'aa3',b:'bb2'},{a:'aa3',b:'bb3'},{a:'aa2',b:'bb3'}],
some = [{a:'aa1',b:'bb1'},{a:'aa3',b:'bb3'}]; 

如果某个对象存在,我正在c中的full新属性中标记。预期结果:

 [{a:'aa1',b:'bb1',c:true},{a:'aa3',b:'bb2'},{a:'aa3',b:'bb3',c:true},{a:'aa2',b:'bb3'}]

一些重要提示:

  • 有些元素总是少于完整
  • 两个数组的排序相等

我目前的做法是:

var getIndexByAB = function(arr, a,b){
     var initialIndex =  getIndexByAB.initialIndex || 0,
     len = arr.length;
     for(initialIndex; initialIndex < len ;initialIndex++ ){
         var el = arr[initialIndex];
         if( el.b === b && el.a === a ){
             getIndexByAB.initialIndex = initialIndex;
             return initialIndex;
         }
     }
     return -1;
}

var len = some.length;
for(var i = 0; i < len ; i++){
 var el=some[i],
 index = getIndexByAB(full,el.a,el.b);
 if(index > -1) full[index].c = true;
}

UPDADE :使用Juan评论改进了原始解决方案。

3 个答案:

答案 0 :(得分:1)

由于它们已经排序,您只需传递索引即可开始搜索,这将避免O(n ^ 2)。您已经在做了,但是将索引存储在全局变量中。相反,您应该将其作为参数传递给getIndexByAB

function getIndexByAB(arr, a,b , initialIndex){
    // Was tracking last index by storing it in a global 'this.initialIndex'. 
    // 'this' points to 'window' in global functions. That's bad, it 
    // means this function can't be called on different arrays without
    // resetting the global 

    // var initialIndex =  this.initialIndex || 0,

    initialIndex = initialIndex || 0;
    var len = arr.length;
    for(initialIndex; initialIndex < len ; initialIndex++ ){
        var el = arr[initialIndex];
        if( el.b === b && el.a === a ){
            // Bad globals
            // this.initialIndex = initialIndex;
            return initialIndex;
        }
    }
    return -1;
}

var len = some.length;
var lastValidIndex = 0;
for(var i = 0; i < len ; i++){
    var el = some[i];
    // Pass the index here, so it doesn't start from scratch
    var index = getIndexByAB(full, el.a, el.b, lastValidIndex);
    if(index > -1) {
        full[index].c = true;
        lastValidIndex = index;
    }
}

顺便说一句,如果你想要一个函数来缓存一些值,这里是如何避免全局变量。 (不是说你应该在这种情况下使用它)

var getIndexByAB = (function(){
     // This will only be executed once, and is private
     // to getIndexByAB (all invocations)
     var lastGoodIndex = 0;

     return function(arr, a,b, resetIndex){
         if (resetIndex) {
            lastGoodIndex = 0;
         }

         var len = arr.length;
         for(var index = lastGoodIndex; index < len ; index++ ){
             var el = arr[index];
             if( el.b === b && el.a === a ){                 
                 lastGoodIndex = index;
                 return index;
             }
         }
         return -1;
    };
})();

或者,您可以通过在getIndexByAB.initialIndex中缓存它来实现以下目的,但它不是很优雅。避免这种情况的主要原因是任何人都可以修改getIndexByAB.initialIndex

答案 1 :(得分:0)

由于数组都已排序且some严格小于full,因此可以通过使用不同索引同时遍历两个数组来节省一些时间。实际上,您每次都要遍历full以获取匹配元素的索引,因此您有 O(N ^ 2)的运行时间,但您只需要继续搜索来自您匹配的最后一个元素。

答案 2 :(得分:0)

不如@Juan的回答那样有效(利用排序的性质,除其他外),但我认为我仍然提出我的解决方案,因为它偶然迫使我想出克隆和比较Javacript的解决方案对象。

实用程序

// Create a copy of x without reference back to x
function clone(x){
  return JSON.parse(JSON.stringify(x));
}

// Pass any number of arguments of any type. Returns true if they are all identical.
function areEqual(){
  for(var i = 1, l = arguments.length, x = JSON.stringify(arguments[0]); i < arguments.length; ++i){
    if(x !== JSON.stringify(arguments[i])){
      return false;
    }
  }

  return true;
}

标记功能

// Your flagLabel being 'c'
function matchAndFlagWith(flagLabel,aFull,aSome){
  var aFlagged = clone(aFull);

  for(var i1 = 0, l1 = aSome.length, oSome; oSome = aSome[i1], i1 < l1; ++i1){
    for(var i2 = 0, l2 = aFlagged.length, oFlagged; oFlagged = aFlagged[i2], i2 < l2; ++i2){
      if(areEqual(oFlagged,oSome)){
        oFlagged[flagLabel] = true;
      }
    }
  }

  return aFlagged;
}

演示

http://jsfiddle.net/barney/p2qsG/