使用大量对象过滤数组的唯一名称

时间:2018-04-27 07:33:02

标签: ios swift performance

我目前正在抓取很多包含街道名称和坐标的对象。返回的数组有大约22.000个对象,我们想要的结果数组大约有4000个,其余的都是重复的。这种数据的问题在于获取的对象可以具有相同的名称但是具有不同的坐标,并且我只对基于唯一名称获取对象感兴趣。如果有多个具有相同名称的对象,我只想保留第一个对象。

到目前为止,我一直试图通过比较名字来环游街道。我宁愿使用filter或其他一些性能更高的解决方案。

我的结构

struct StreetName {
    var name: String
    var polyLine: CLLocationCoordinate2D
}

到目前为止我的代码

DataManager.shared.getStreetNames { (streets) in  
    var namesArray: [StreetName] = []
    for streetName in streets {
        let name = streetName.name
        if namesArray.count == 0 {
            namesArray.append(streetName)
        } else if namesArray.contains(where: {$0.name == name }) { 
             /* Dont add */ 
        } else {
             namesArray.append(streetName)
        }
    }

    self.streetNames = namesArray.sorted(by: {$0.name < $1.name})
    self.filteredStreetNames = self.streetNames
    OperationQueue.main.addOperation {
        self.streetTableView.reloadData()
    }
}

此代码块有效,但在iPhone X上运行大约30秒。这太慢了。有什么想法吗?

3 个答案:

答案 0 :(得分:2)

我认为如果您对此进行了分析,您会发现sort占用的时间最多。我无法找到官方说明,但基础实施很有可能快速排序,当数组已经排序时,它的复杂性最差(或者数组以相反的顺序排序)。

快速排序的平均案例复杂度为O(n log n),但在最坏的情况下,它是O(n 2 )。

我认为您应该实现插入排序,或者更准确地说,始终将新元素插入已排序的位置。这样可以将整个函数的复杂度降低到O(n)。

<强>伪代码:

  • 获取街道名称
  • 对于每个街道名称
    • 找到街道名称所在的现有数组中的位置(我建议二进制搜索,因为数组已经排序)
    • 如果街道名称已存在,请跳过
    • 如果名称不存在,请插入。

结果应该是一个排序的唯一街道名称数组,要求每个名称只能读取和插入一次。

答案 1 :(得分:1)

我对此的看法:

print(array)

最后,打印结果:

console
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99]

控制台上的示例输出: {{1}}

答案 2 :(得分:1)

@MartinR使用Sets解决了这个问题。

我新更新的结构

struct StreetName: Hashable {
    static func == (lhs: StreetName, rhs: StreetName) -> Bool {
        return lhs.name == rhs.name
    }

    var hashValue: Int {
        return name.hashValue
    }

    var name: String
    var polyLine: CLLocationCoordinate2D
}

我的新更新代码

DataManager.shared.getStreetNames { (returnedNamesSet) in
    var namesArray: [StreetName] = Array(returnedNamesSet)

    self.streetNames = namesArray.sorted(by: {$0.name < $1.name})
    self.filteredStreetNames = self.streetNames
    OperationQueue.main.addOperation {
        self.streetTableView.reloadData()
    }
}


结果:

使用Set

,处理时间从30秒变为0.4秒