Kosaraju的scc算法

时间:2018-12-08 06:35:43

标签: python algorithm graph kosaraju-algorithm

有人可以向我解释Kosaraju查找关联组件的算法背后的逻辑吗?

我已经读过description,尽管我不明白反转图上的DFS如何检测强连接的组件数。

def dfs(visited, stack, adj, x):
    visited[x] = 1

    for neighbor in adj[x]:
        if (visited[neighbor]==0):
            dfs(visited, stack, adj, neighbor)

    stack.insert(0, x)
    return stack, visited

def reverse_dfs(visited, adj, x, cc):
    visited[x] = 1

    for neighbor in adj[x]:
        if (visited[neighbor]==0):
            cc += 1
            reverse_dfs(visited, adj, neighbor,cc)
    print(x)
    return cc


def reverse_graph(adj):
    vertex_num = len(adj)
    new_adj = [ [] for _ in range(vertex_num)]
    for i in range(vertex_num):
        for j in adj[i]:
            new_adj[j].append(i)
    return new_adj


def find_post_order(adj):
    vertex_num = len(adj)
    visited = [0] * vertex_num
    stack = []

    for vertex in range(vertex_num):
        if visited[vertex] == 0:
            stack, visited = dfs(visited, stack, adj, vertex)

    return stack


def number_of_strongly_connected_components(adj):
    vertex_num = len(adj)
    new_adj = reverse_graph(adj)
    stack = find_post_order(adj)

    visited = [0] * vertex_num
    cc_num = 0
    while (stack):
        vertex = stack.pop(0)
        print(vertex)
        print('------')
        if visited[vertex] == 0:
            cc_num = reverse_dfs(visited, new_adj, vertex, cc_num)
    return cc_num

if __name__ == '__main__':
    input = sys.stdin.read()
    data = list(map(int, input.split()))
    n, m = data[0:2]
    data = data[2:]
    edges = list(zip(data[0:(2 * m):2], data[1:(2 * m):2]))
    adj = [[] for _ in range(n)]
    for (a, b) in edges:
        adj[a - 1].append(b - 1)
    print(number_of_strongly_connected_components(adj))

上面您可以找到我的实现。我想初始DFS和反向操作正确完成了,但是我不知道如何正确执行第二个DFS。 预先感谢。

1 个答案:

答案 0 :(得分:1)

您应该注意的第一件事是,图及其反向图的强连接组件集相同。实际上,该算法实际上是在反向图中找到了一组强连接的组件,而不是原始的(但没关系,因为两个图具有相同的SCC)。

第一次执行DFS会导致堆栈按特定顺序保存顶点,这样,当第二次DFS以此顺序在顶点上执行(在逆向图上)时,它将正确计算SCC。因此,运行第一个DFS的全部目的是找到图顶点的顺序,该顺序用于在反向图上执行DFS算法。现在,我将解释堆栈中顶点顺序的属性是什么,以及它如何服务于反向图中DFS的执行。

那么堆栈的属性是什么?想象S1和S2是图中的两个牢固连接的组件,而在反向图中,S2可从S1到达。显然,也无法从S2到达S1,因为如果是这种情况,S1和S2将会崩溃为一个组件。令x为S1中顶点中的最高顶点(也就是说,S1中的所有其他顶点都在堆栈中的x之下)。同样,令y为S2中顶点的顶部顶点(同样,S2中的所有其他顶点在堆栈中的y之下)。该属性是y(属于S2)在堆栈中高于x(属于S1)。

该酒店为什么有帮助?当我们在反转图上执行DFS时,我们将根据堆栈顺序进行操作。特别是,我们在探索x之前先探索y。在探索y时,我们探索了S2的每个顶点,并且由于无法从S2到达S1的顶点,因此我们在探索S1的任何顶点之前先探索S2的所有顶点。但这适用于任何一对连接的组件,使得一个组件可以相互连接。特别是,堆栈顶部的顶点属于接收器组件,在我们完成了该接收器组件的探索之后,相对于尚未探索的顶点所诱导的图,顶部顶点再次属于接收器。

因此,该算法正确计算了逆向图的所有强连通分量,如上所述,这些分量与原始图相同。