排序数组时删除重复项

时间:2012-08-17 09:14:54

标签: javascript arrays sorting

我有一个包含我需要排序的对象的数组,并根据每个数组项的3个特定值删除重复项。目前我正在使用两个循环(非嵌套):1来排序,另一个是删除项目。有没有办法在排序或类似的东西时删除重复?对于1000个项目,以下代码非常慢,我想知道是否有更快的方法:

var list = [
    {a: "Somename", b: "b", c: 10},
    {a: "Anothername", b: "a", c: 12},
    // and so on
];
function sortList(list) {
    // Sort the list based on the 3 specific values
    list = list.sort(function(a,b) {
        a.a = a.a.toLowerCase();
        b.a = b.a.toLowerCase();
        if (a.a < b.a) return -1;
        if (a.a > b.a) return 1;

        a.b = a.b.toLowerCase();
        b.b = b.b.toLowerCase();
        if (a.b < b.b) return -1;
        if (a.b > b.b) return 1;

        if (a.c < b.c) return -1;
        if (a.c > b.c) return 1;

        return 0;
    });

    // Loop through removing duplicates
    for (var a,b,i=list.length-1; i > 0; i--) {
        a = list[i];
        a.a = a.a.toLowerCase();
        a.b = a.b.toLowerCase();

        b = list[i-1];
        b.a = b.a.toLowerCase();
        b.b = b.b.toLowerCase();

        if (a.a===b.a && a.b===b.b && a.c===b.c) list.splice(i-1,1);
    }

    return list;
}
list = sortList(list);

请不要jQuery答案,或建议使用其他库的答案。导入库来执行这么简单的事情似乎有点过分。

2 个答案:

答案 0 :(得分:0)

不要在第二个循环中使用splice,只需将唯一值放在新数组中即可。因此,在每次迭代而不是splice现有数组时,您只需将值附加到新数组; pushsplice快得多。 E.g:

var newList = [];
if (list) {
    newList.push(list[0];
    for (var a,b,i=1; i < list.length; i++) {
        a = list[i];
        a.a = a.a.toLowerCase();
        a.b = a.b.toLowerCase();

        b = list[i-1];
        b.a = b.a.toLowerCase();
        b.b = b.b.toLowerCase();

        if (a.a!==b.a || a.b!==b.b && a.c!==b.c) {
            newList.push(a);
        }
    }
}

答案 1 :(得分:0)

搜索完之后,我想出了自己的答案。它仍然使用两个循环但这比排序然后删除重复要快得多,并且比排序时跟踪重复更加一致。基本上,我循环遍历数组,使用属性值('key')的串联保存对象中的每个项目我想要排序/删除重复项。如果密钥已经存储,我知道它是重复的,可以继续下一个。否则,我将该项添加到新数组。删除重复项后,我对数组进行排序并将其返回:

function sortList(list){
    // Since the 3 properties I'm sorting by can be converted to string I can loop
    // through the specified array, creating 'keys' by concating those property values
    // and adding those 'keys' to a temporary object. If the 'key' is present in the
    // temporary object, I know it's a duplicate in the array and can ignore it.
    // Otherwise I know it's not a duplicate and add it to a new array
    for (var a=0,b=list.length,item,key="",dupObj={},nList=[]; a<b; a++) {
        item=list[a];
        key=item.a.toLowerCase()+"_"+item.b.toLowerCase()+"_"+item.c;
        if(!dupObj[key]) {
            dupObj[key]=true;
            nList.push(item);
        }
    }

    // Now that we have an array without duplicates we can sort the array:
    nList.sort(function(a,b) {
        if ((a.a = a.a.toLowerCase()) < (b.a = b.a.toLowerCase()) return -1;
        if (a.a > b.a) return 1;

        if ((a.b = a.b.toLowerCase()) < (b.b = b.b.toLowerCase())) return -1;
        if (a.b > b.b) return 1;

        if (a.c < b.c) return -1;
        if (a.c > b.c) return 1;

        return 0;
    });

    // return the new list
    return nList;
}
var list = [
    {a: "Somename", b: "b", c: 10},
    {a: "Anothername", b: "a", c: 12},
    // and so on
];
list = sortList(list);