在列表列表中查找重叠列表

时间:2019-03-27 15:19:37

标签: python algorithm computer-science graph-algorithm

我有一个列表列表,需要根据列表项的常见情况进行合并。共享元素的列表需要合并在一起以形成集群。

我考虑过采用广度优先遍历,但是由于列表列表的排列方式,很难实现遍历

列表示例:

input: 
[
 [1,2,3],
 [2,4,5],
 [4,6,8],
 [9,10,16],
 [16,18,19],
 [20,21,22]
]
output: [[1,2,3,4,5,6,8], [9,10,16,18,19], [20,21,22]]

前三个列表需要合并为一个列表(第一个列表和第二个列表具有2个,第二个和第三个列表共享4),第四个和第五个因为两个共享16而需要合并。不与任何其他列表合并,因为它与其他列表不共享任何元素。

虽然这可以在O(n ^ 2)时间内完成(n是列表数),但我正在尝试找到最有效的方法。

2 个答案:

答案 0 :(得分:1)

您可以在O(N * log N)中执行此操作,其中N是所有列表中项目的总数。

使用联合查找数据结构,这个想法很简单:

  1. 首先让我们为输入中的每个唯一项创建N个不相交集
  2. 合并每个列表的所有相邻项的不交集
  3. 从不交集中收集结果

示例代码:

def Find(id,P):
    if P[id]<0 : return id
    P[id]=Find(P[id],P)
    return P[id]

def Union(id1, id2, p):
    id1 = Find(id1,P)
    id2 = Find(id2,P)
    if id1 != id2:
        P[id2]=id1

input=[
 [1,2,3],
 [2,4,5],
 [4,6,8],
 [9,10,16],
 [16,18,19],
 [20,21,22]
]

P = {}

for list in input :
    for item in list :
        P[item] = -1

for list in input :
    for i in range(1,len(list)):
            Union(list[i-1], list[i], P)

ans = {}
for list in input :
    for item in list :
        if Find(item,P) not in ans:
            ans[Find(item,P)] = []
        ans[Find(item,P)].append(item)

ans = [set(x) for x in ans.values()]
print(ans)

答案 1 :(得分:1)

您的内部列表没有重复的元素。如果这是一般情况,那么Rosetta Code上的set comsolidation任务将提供可以使用的Python解决方案。