加权中值计算

时间:2012-03-20 20:39:09

标签: c++ algorithm

我正在寻找有关C ++中加权中值算法和/或样本代码计算的优秀学习资料。我的中位数的权重是0到1之间的值。你能推荐一些链接吗?

2 个答案:

答案 0 :(得分:18)

加权中位数的定义如下:

如果xN元素的排序数组,而w是权重数组,总权重W,那么加权中位数是最后一个{ {1}} x[i]和之前所有权重的总和小于或等于w[i]

在C ++中,可以这样表达(假设S/2xw定义如上)

W

修改

所以我似乎匆匆回答了这个问题并犯了一些错误。我从R documentation找到了加权中位数的简洁描述,它描述如下:

  

对于double sum = 0; int i; for(i = 0; i < N; ++i) { sum += w[i]; if(sum > W/2) break; } double median = x[i-1]; 元素n为正面   权重x = c(x[1], x[2], ..., x[n])使w = c(w[1], w[2], ..., w[n]),{。}}   加权中位数定义为初始值为sum(w) = S的元素   所有元素x[k]的总权重小于或等于x[i] < x[k]   并且所有元素S/2的总重量较少   或等于x[i] > x[k]

从这个描述中,我们有一个非常直接的算法实现。如果我们从S/2开始,则k == 0之前没有元素,因此元素x[k]的总权重将小于x[i] < x[k]。根据数据,元素S/2的总重量可能会小于x[i] > x[k],也可能不会小于S/2。因此,我们可以向前移动数组,直到第二个总和小于或等于S/2

#include <cstddef>
#include <numeric>
#include <iostream>

int main()
{
  std::size_t const N = 5;
  double x[N] = {0, 1, 2, 3, 4};
  double w[N] = {.1, .2, .3, .4, .5};

  double S = std::accumulate(w, w+N, 0.0); // the total weight

  int k = 0;
  double sum = S - w[0]; // sum is the total weight of all `x[i] > x[k]`

  while(sum > S/2)
  {
    ++k;
    sum -= w[k];
  }

  std::cout << x[k] << std::endl;
}

请注意,如果中位数是最后一个元素(medianIndex == N-1),那么sum == 0,则条件sum > S/2会失败。因此,k永远不会超出范围(除非N == 0!)。此外,如果有两个元素满足条件,则算法始终选择第一个。

答案 1 :(得分:2)

这是最初未分类矢量的加权中值的实现。它建立在@Ken Wayne VanderLinde对中位数计算以及this thread中给出的索引排序器的非常好的答案的基础上。

    template <typename VectorType>
    auto sort_indexes(VectorType const& v)
    {
        std::vector<int> idx(v.size());
        std::iota(std::begin(idx), std::end(idx), 0);

        std::sort(std::begin(idx), std::end(idx), [&v](int i1, int i2) {return v[i1] < v[i2];});

        return idx;
    }

    template<typename VectorType1, typename VectorType2>
    auto weightedMedian(VectorType1 const& x, VectorType2 const& weight)
    {
        double totalWeight = 0.0;
        for (int i = 0; i < static_cast<int>(x.size()); ++i)
        {
            totalWeight += weight[i];
        }

        auto ind = sort_indexes(x);

        int k = ind[0];
        double sum = totalWeight - weight[k];

        for (int i = 1; i < static_cast<int>(ind.size()); ++i)
        {
            k = ind[i];
            sum -= weight[k];

            if (sum <= 0.5 * totalWeight)
            {
                break;
            }
        }
        return x[k];
    }

适用于支持operator[](int)size()的任何矢量类型(因此不会使用std::accumulate等。)