标签: python dynamic-programming cp subset-sum

给定一个包含 N 个元素的数组,找出数组的所有子集,其总和等于目标值。


  • 输入的第一行包含一个整数 N 大小的数组
  • 第二行包含以空格分隔的数组元素
  • 目标总和值


  • 打印所有子数组(元素索引)。

我的代码对于小输入工作正常,但 N > 150 需要很长时间。 有没有其他有效的算法可以做到这一点。 请告诉我如何针对更大的输入优化此代码。

from collections import deque

class Pair:
    def __init__(self, i, j, path_set):
        self.i = i
        self.j = j
        self.path_set = path_set

def get_subsets(arr, n, value): 
    This function appends all the possible paths in result list for the given target sum
        arr = A list of numbers
        n = number of elements in that list arr
        value = Target sum for which we want to generate table
    # return immediately if there is no possible subset in arr whose sum is equal to value
    if dp[n][value] == False:
    queue = deque()
    queue.append(Pair(n, value, set()))

    while len(queue) > 0:
        pair = queue.popleft()
        if pair.i == 0 or pair.j == 0:
            exclude = dp[pair.i - 1][pair.j]
            if exclude:
                queue.append(Pair(pair.i-1, pair.j, pair.path_set))

            if pair.j >= arr[pair.i-1]:
                include = dp[pair.i - 1][pair.j - arr[pair.i -1]]
                if include:
                    b = pair.path_set.copy()
                    b.add(pair.i - 1)
                    queue.append(Pair(pair.i - 1, pair.j-arr[pair.i-1], b))

def make_dp(arr, n, value):
    This function makes a table of target sum equal to the value
        arr = A list of numbers
        n = number of elements in that list arr
        value = Target sum for which we want to generate table
        dp = A 2D boolean table
    dp = [[False for i in range(value+1)] for j in range(n+1)]
    for i in range(n+1):
        for j in range(value+1):
            if j ==0:
                dp[i][j] = True
            elif i == 0:
                dp[i][j] = False
                if dp[i-1][j]:
                    dp[i][j] = True
                elif j >=arr[i-1]:
                    if dp[i-1][j-arr[i-1]]:
                        dp[i][j] = True
    return dp

if __name__ == '__main__':
    n = int(input())
    arr = list(map(int, input().split()))
    value = int(input())
    dp = make_dp(arr, n, value)
    result = []
    get_subsets(arr, n, value)


请优化此代码或告诉我执行相同操作的任何其他方法。 提前致谢。

2 个答案:

答案 0 :(得分:0)

您可能会发现使用 itertools 和组合会更有效一些。代码也简单多了。

from itertools import chain, combinations

li = [1,2,3,4,5,6]

itr=chain.from_iterable(combinations(li, n) for n in range(len(li)+1))

result = [el for el in itr if sum(el)==s]



[(1, 5, 6), (2, 4, 6), (3, 4, 5), (1, 2, 3, 6), (1, 2, 4, 5)]

答案 1 :(得分:0)

您可以通过创建指向其各自索引的累积总和字典,在 O(n) 时间内获得此信息。当字典中存在总和 s+T 的总和 s 时,您的范围加起来为 T

from itertools import accumulate

A      = list(range(1,201))
T      = 200
sums   = {s:i for i,s in enumerate(accumulate(A)) }
result = [ [*range(i+1,sums[s+T]+1)] for s,i in sums.items() if s+T in sums ]

# [[4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19], 
#  [37, 38, 39, 40, 41], 
#  [199]]

即使列表中有 100 万个值,这也只需要不到一秒钟的时间。

请注意,这里假设数组中的所有元素都 > 0。


from itertools import accumulate
A      = [*range(-10,11)]
T      = 20

sums   = dict()
for i,s in enumerate(accumulate(A)):
result = []
for cum,starts in sums.items():
    if cum+T not in sums: continue
    result.extend( [*range(s+1,e+1)] for s in starts 
                                     for e in sums[cum+T] if s<e )

# [-10, -9, -8, -7, -6, -5, -4, -3, -2, -1, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

# [[9, 10, 11, 12, 13, 14, 15, 16], [12, 13, 14, 15, 16]]

对于包含 100 万个值的列表,这需要 2-3 秒,但根据结果的大小可能会更长。
