生成{0,1,2,... n-1}的所有大小k个子集

时间:2012-09-09 21:21:11

标签: c++ stl

我想在C ++中生成k的所有基数{0, 1, 2, ..., n-1}子集。在Haskell,我会这样做:

sets 0 n = [[]]
sets k n = [i:s | i <- [0..n-1], s <- sets (k-1) i]

或者在Python中:

def sets(k, n):
    if k == 0:
        return [()]
    return ((i,)+s for i in range(n) for s in sets(k-1, i))

因此,例如,(为了清晰起见,添加了换行符)

ghci> sets 2 8
[[1,0],
 [2,0],[2,1],
 [3,0],[3,1],[3,2],
 [4,0],[4,1],[4,2],[4,3],
 [5,0],[5,1],[5,2],[5,3],[5,4],
 [6,0],[6,1],[6,2],[6,3],[6,4],[6,5],
 [7,0],[7,1],[7,2],[7,3],[7,4],[7,5],[7,6]]

这样做的“C ++方式”是什么?请注意,我不是要求如何来解决问题。我问的是C ++程序员认为哪些数据类型是“正常的”。

(作为参考,我对C ++有点熟悉,对C有些熟悉。)

5 个答案:

答案 0 :(得分:4)

这是一种天真的递归方法,它实现了经典的组合身份:

binom(n + 1, k + 1) = binom(n, k + 1) + binom(n, k)


#include <set>

typedef std::set<int> intset;

std::set<intset> subsets(std::size_t k, intset s)
{
    if (k == 0 || s.empty() || s.size() < k) { return { { } }; }

    if (s.size() == k) { return { s }; }

    auto x = *s.begin();
    s.erase(s.begin());

    std::set<intset> result;

    for (auto & t : subsets(k - 1, s))
    {
        auto r = std::move(t);
        r.insert(x);
        result.insert(std::move(r));
    }

    for (auto & t : subsets(k, s))
    {
        results.insert(std::move(t));
    }

    return result;
}

用法:

auto ss = subsets(3, {0, 1, 2, 3, 4});

完整示例:

#include <iostream>
#include <string>
#include <prettyprint.hpp>

int main(int argc, char * argv[])
{
    if (argc != 3) return 1;

    auto k = std::stoul(argv[1]);
    auto n = std::stoul(argv[2]);

    intset s;
    for (auto i = 0U; i != n; ++i) s.insert(i);

    std::cout << subsets(k, s) << std::endl;
}

答案 1 :(得分:2)

Rosetta代码an implementation通过获取列表k的排列的第一个0, 1, ..., n-1条目来工作。它使用C ++ STL。

答案 2 :(得分:1)

一组所有子集的概念称为power set,维基百科上有相当多的内容。有一部分甚至致力于algorithms做你想做的事。此特定问题请求幂集的subsets of limited cardinality。您应该使用std::set

答案 3 :(得分:1)

C中的快速实现(使用递归)如下:

#include <stdio.h>

#define N 8
#define K 3

void print_combination(int* combination, int k)
{
    int i;
    for (i = 0; i < k; i++){
        printf("%d ", combination[i]);
    }
    printf("\n");
}

void find_all_combinations(int idx, int* in_use, int* combination,
        int n, int k)
{
    int i;
    if (idx == k){
        print_combination(combination, k);
        return;
    }

    for (i = 0; i < n; i++){
        if (in_use[i]){
            continue;
        }

        in_use[i] = 1;
        combination[idx++] = i + 1;

        find_all_combinations(idx, in_use, combination, n, k);

        combination[--idx] = 0;
        in_use[i] = 0;
    }
}

int main(void)
{
    /* Ensure that the arrays are initialized with zeroes. */
    int in_use[N] = {0};
    int curr_combination[K] = {0};
    find_all_combinations(0, in_use, curr_combination, N, K);

    return 0;
}

答案 4 :(得分:0)

C ++中的另一种递归解决方案。函数ksubsets并不希望输入(arr)是一个集合,它可以由可以迭代的任何容器(在本示例中,我使用vector),并且可以包含重复项。 该函数生成存储在k-sized中的数字的所有arr子集。子集存储在res中。

#include<vector>

using namespace std;

void ksubsets(const vector<int>& arr, unsigned ksize, unsigned idx,
    vector<int>& tmp, vector<vector<int>>& res)
{
    if (ksize < 1) {
        res.push_back(tmp);
        return;
    }
    for (unsigned i = idx; i < arr.size(); i++) {
        tmp.push_back(arr[i]);
        ksubsets(arr, ksize - 1, i + 1, tmp, res);
        tmp.pop_back();
    }
}

int main()
{
    vector<int>arr = {1,2,3,4};
    vector<vector<int>> result;
    vector<int> cur;
    unsigned ksize = 3;
    ksubsets(arr, ksize, 0, cur, result); 

   // use here the result, it contains vectors {1,2,3}, {1,2,4},{1,3,4},{2,3,4}
}