如何通过不同的std :: vector的值对std :: vector进行排序?

时间:2008-10-25 09:52:58

标签: c++ stl boost vector sorting

我有几个std::vector,长度都相同。我想对这些向量中的一个进行排序,并将相同的变换应用于所有其他向量。这样做有一个简洁的方法吗? (最好使用STL或Boost)?有些向量包含int s,其中一些向量std::string

伪代码:

std::vector<int> Index = { 3, 1, 2 };
std::vector<std::string> Values = { "Third", "First", "Second" };

Transformation = sort(Index);
Index is now { 1, 2, 3};

... magic happens as Transformation is applied to Values ...
Values are now { "First", "Second", "Third" };

13 个答案:

答案 0 :(得分:29)

与你的相结合,friol的方法很好。首先,构建一个由数字1 ... n 组成的向量,以及指示排序顺序的向量中的元素:

typedef vector<int>::const_iterator myiter;

vector<pair<size_t, myiter> > order(Index.size());

size_t n = 0;
for (myiter it = Index.begin(); it != Index.end(); ++it, ++n)
    order[n] = make_pair(n, it);

现在您可以使用自定义排序器对此数组进行排序:

struct ordering {
    bool operator ()(pair<size_t, myiter> const& a, pair<size_t, myiter> const& b) {
        return *(a.second) < *(b.second);
    }
};

sort(order.begin(), order.end(), ordering());

现在您已经捕获了order内部重新排列的顺序(更确切地说,在项目的第一个组件中)。您现在可以使用此排序来对其他向量进行排序。可能有一个非常聪明的就地变体在同一时间运行,但在其他人提出它之前,这里有一个不适合的变体。它使用order作为每个元素的新索引的查找表。

template <typename T>
vector<T> sort_from_ref(
    vector<T> const& in,
    vector<pair<size_t, myiter> > const& reference
) {
    vector<T> ret(in.size());

    size_t const size = in.size();
    for (size_t i = 0; i < size; ++i)
        ret[i] = in[reference[i].first];

    return ret;
}

答案 1 :(得分:8)

将您的值放在Boost Multi-Index container中,然后迭代以按您想要的顺序读取值。如果您愿意,甚至可以将它们复制到另一个向量中。

答案 2 :(得分:8)

typedef std::vector<int> int_vec_t;
typedef std::vector<std::string> str_vec_t;
typedef std::vector<size_t> index_vec_t;

class SequenceGen {
  public:
    SequenceGen (int start = 0) : current(start) { }
    int operator() () { return current++; }
  private:
    int current;
};

class Comp{
    int_vec_t& _v;
  public:
    Comp(int_vec_t& v) : _v(v) {}
    bool operator()(size_t i, size_t j){
         return _v[i] < _v[j];
   }
};

index_vec_t indices(3);
std::generate(indices.begin(), indices.end(), SequenceGen(0));
//indices are {0, 1, 2}

int_vec_t Index = { 3, 1, 2 };
str_vec_t Values = { "Third", "First", "Second" };

std::sort(indices.begin(), indices.end(), Comp(Index));
//now indices are {1,2,0}

现在您可以使用“indices”向量来索引“Values”向量。

答案 3 :(得分:4)

只有一个粗略的解决方案出现在我的脑海中:创建一个向量,它是所有其他向量的总和(结构向量,如{3,Third,...},{1,First,...})然后按第一个字段对此向量进行排序,然后再次拆分结构。

可能在Boost内部或使用标准库有更好的解决方案。

答案 4 :(得分:3)

您可以定义一个自定义的“facade”迭代器,它可以满足您的需求。它会将迭代器存储到所有向量中,或者从第一个向量的偏移量中为除第一个向量之外的所有向量导出迭代器。棘手的部分是迭代器取消引用的内容:想想像boost :: tuple这样的东西并巧妙地使用boost :: tie。 (如果你想扩展这个想法,你可以使用模板递归地构建这些迭代器类型,但你可能永远不想写下它的类型 - 所以你要么需要c ++ 0x auto,要么需要包装范围的包装函数)

答案 5 :(得分:2)

我认为你真正需要的东西(但如果我错了,请纠正我)是一种以某种顺序访问容器元素的方法。

我不是重新安排我的原始集合,而是从数据库设计中借用一个概念:保留一个索引,按一定的标准排序。该索引是一个额外的间接,提供了很大的灵活性。

这样就可以根据类的不同成员生成多个索引。

using namespace std;

template< typename Iterator, typename Comparator >
struct Index {
    vector<Iterator> v;

    Index( Iterator from, Iterator end, Comparator& c ){
        v.reserve( std::distance(from,end) );
        for( ; from != end; ++from ){
            v.push_back(from); // no deref!
        }
        sort( v.begin(), v.end(), c );
    }

};

template< typename Iterator, typename Comparator >
Index<Iterator,Comparator> index ( Iterator from, Iterator end, Comparator& c ){
    return Index<Iterator,Comparator>(from,end,c);
}

struct mytype {
    string name;
    double number;
};

template< typename Iter >
struct NameLess : public binary_function<Iter, Iter, bool> {
    bool operator()( const Iter& t1, const Iter& t2 ) const { return t1->name < t2->name; }
};

template< typename Iter >
struct NumLess : public binary_function<Iter, Iter, bool> {
    bool operator()( const Iter& t1, const Iter& t2 ) const { return t1->number < t2->number; }
};

void indices() {

    mytype v[] =    { { "me"    ,  0.0 }
                    , { "you"   ,  1.0 }
                    , { "them"  , -1.0 }
                    };
    mytype* vend = v + _countof(v);

    Index<mytype*, NameLess<mytype*> > byname( v, vend, NameLess<mytype*>() );
    Index<mytype*, NumLess <mytype*> > bynum ( v, vend, NumLess <mytype*>() );

    assert( byname.v[0] == v+0 );
    assert( byname.v[1] == v+2 );
    assert( byname.v[2] == v+1 );

    assert( bynum.v[0] == v+2 );
    assert( bynum.v[1] == v+0 );
    assert( bynum.v[2] == v+1 );

}

答案 6 :(得分:1)

ltjax的答案是一个很好的方法 - 实际上是在boost的zip_iterator http://www.boost.org/doc/libs/1_43_0/libs/iterator/doc/zip_iterator.html中实现的

它将您提供的任何迭代器打包成一个元组。

然后,您可以根据元组中迭代器值的任意组合为排序创建自己的比较函数。对于这个问题,它只是元组中的第一个迭代器。

这种方法的一个很好的特点是,它允许你保持每个单独的向量的记忆是连续的(如果你使用向量,那就是你想要的)。您也不需要存储单独的整数索引向量。

答案 7 :(得分:1)

如果您只是想基于单个keys向量迭代所有向量,那么xtofl的答案就会更加紧凑。创建一个置换向量,并使用它来索引你的其他向量。

#include <boost/iterator/counting_iterator.hpp>
#include <vector>
#include <algorithm>

std::vector<double> keys = ...
std::vector<double> values = ...

std::vector<size_t> indices(boost::counting_iterator<size_t>(0u), boost::counting_iterator<size_t>(keys.size()));
std::sort(begin(indices), end(indices), [&](size_t lhs, size_t rhs) {
    return keys[lhs] < keys[rhs];
});

// Now to iterate through the values array.
for (size_t i: indices)
{
    std::cout << values[i] << std::endl;
}

答案 8 :(得分:1)

这可能是Konrad答案的附录,因为它是一种将排序顺序应用于向量的就地变体的方法。无论如何,由于编辑不会通过,我会把它放在这里

这是一个原位变体,其时间复杂度略高,这是由于检查布尔值的原始操作所致。额外的空间复杂度是向量,其可以是空间有效的编译器相关实现。如果可以修改给定的顺序本身,则可以消除向量的复杂性。

这是一个原位变体,其时间复杂度略高,这是由于检查布尔值的原始操作所致。额外的空间复杂度是向量,其可以是空间有效的编译器相关实现。如果可以修改给定的顺序本身,则可以消除向量的复杂性。这是算法正在做的一个例子。 如果顺序是3 0 4 1 2,则由位置索引指示的元素的移动将是3 ---> 0; 0 ---→1; 1 ---→3; 2 ---→4; 4 ---&GT; 2

template<typename T>
struct applyOrderinPlace
{
void operator()(const vector<size_t>& order, vector<T>& vectoOrder)
{
vector<bool> indicator(order.size(),0);
size_t start = 0, cur = 0, next = order[cur];
size_t indx = 0;
T tmp; 

while(indx < order.size())
{
//find unprocessed index
if(indicator[indx])
{   
++indx;
continue;
}

start = indx;
cur = start;
next = order[cur];
tmp = vectoOrder[start];

while(next != start)
{
vectoOrder[cur] = vectoOrder[next];
indicator[cur] = true; 
cur = next;
next = order[next];
}
vectoOrder[cur] = tmp;
indicator[cur] = true;
}
}
};

答案 9 :(得分:0)

以下是在有序和无序names之间使用索引映射的相对简单的实现,它将用于匹配ages与有序names

void ordered_pairs()
{
    std::vector<std::string> names;
    std::vector<int> ages;

    // read input and populate the vectors
    populate(names, ages);

    // print input
    print(names, ages);

    // sort pairs
    std::vector<std::string> sortedNames(names);
    std::sort(sortedNames.begin(), sortedNames.end());

    std::vector<int> indexMap;
    for(unsigned int i = 0; i < sortedNames.size(); ++i)
    {
        for (unsigned int j = 0; j < names.size(); ++j)
        {
            if (sortedNames[i] == names[j]) 
            {
                indexMap.push_back(j);
                break;
            }
        }
    }
    // use the index mapping to match the ages to the names
    std::vector<int> sortedAges;
    for(size_t i = 0; i < indexMap.size(); ++i)
    {
        sortedAges.push_back(ages[indexMap[i]]);
    }

    std::cout << "Ordered pairs:\n";
    print(sortedNames, sortedAges); 
}

为了完整起见,这里有函数populate()print()

void populate(std::vector<std::string>& n, std::vector<int>& a)
{
    std::string prompt("Type name and age, separated by white space; 'q' to exit.\n>>");
    std::string sentinel = "q";

    while (true)
    {
        // read input
        std::cout << prompt;
        std::string input;
        getline(std::cin, input);

        // exit input loop
        if (input == sentinel)
        {
            break;
        }

        std::stringstream ss(input);

        // extract input
        std::string name;
        int age;
        if (ss >> name >> age)
        {
            n.push_back(name);
            a.push_back(age);
        }
        else
        {
            std::cout <<"Wrong input format!\n";
        }
    }
}

void print(const std::vector<std::string>& n, const std::vector<int>& a)
{
    if (n.size() != a.size())
    {
        std::cerr <<"Different number of names and ages!\n";
        return;
    }

    for (unsigned int i = 0; i < n.size(); ++i)
    {
         std::cout <<'(' << n[i] << ", " << a[i] << ')' << "\n";
    }
}

最后,main()变为:

#include <iostream>
#include <sstream>
#include <string>
#include <vector>
#include <algorithm>

void ordered_pairs();
void populate(std::vector<std::string>&, std::vector<int>&);
void print(const std::vector<std::string>&, const std::vector<int>&);

//=======================================================================
int main()
{
    std::cout << "\t\tSimple name - age sorting.\n";
    ordered_pairs();
}
//=======================================================================
// Function Definitions...

答案 10 :(得分:0)

**// C++ program to demonstrate sorting in vector
// of pair according to 2nd element of pair
#include <iostream>
#include<string>
#include<vector>
#include <algorithm>

using namespace std;

// Driver function to sort the vector elements
// by second element of pairs
bool sortbysec(const pair<char,char> &a,
              const pair<int,int> &b)
{
    return (a.second < b.second);
}

int main()
{
    // declaring vector of pairs
    vector< pair <char, int> > vect;

    // Initialising 1st and 2nd element of pairs
    // with array values
    //int arr[] = {10, 20, 5, 40 };
    //int arr1[] = {30, 60, 20, 50};
    char arr[] = { ' a', 'b', 'c' };
    int arr1[] = { 4, 7, 1 };

    int n = sizeof(arr)/sizeof(arr[0]);

    // Entering values in vector of pairs
    for (int i=0; i<n; i++)
        vect.push_back( make_pair(arr[i],arr1[i]) );

    // Printing the original vector(before sort())
    cout << "The vector before sort operation is:\n" ;
    for (int i=0; i<n; i++)
    {
        // "first" and "second" are used to access
        // 1st and 2nd element of pair respectively
        cout << vect[i].first << " "
             << vect[i].second << endl;

    }

    // Using sort() function to sort by 2nd element
    // of pair
    sort(vect.begin(), vect.end(), sortbysec);

    // Printing the sorted vector(after using sort())
    cout << "The vector after sort operation is:\n" ;
    for (int i=0; i<n; i++)
    {
        // "first" and "second" are used to access
        // 1st and 2nd element of pair respectively
        cout << vect[i].first << " "
             << vect[i].second << endl;
    }
    getchar();
    return 0;`enter code here`
}**

答案 11 :(得分:0)

使用C ++ 11 lambda和STL算法,该算法基于Konrad Rudolph和Gabriele D'Antona的答案:

template< typename T, typename U >
std::vector<T> sortVecAByVecB( std::vector<T> & a, std::vector<U> & b ){

    // zip the two vectors (A,B)
    std::vector<std::pair<T,U>> zipped(a.size());
    for( size_t i = 0; i < a.size(); i++ ) zipped[i] = std::make_pair( a[i], b[i] );

    // sort according to B
    std::sort(zipped.begin(), zipped.end(), []( auto & lop, auto & rop ) { return lop.second < rop.second; }); 

    // extract sorted A
    std::vector<T> sorted;
    std::transform(zipped.begin(), zipped.end(), std::back_inserter(sorted), []( auto & pair ){ return pair.first; }); 

    return sorted;
}

答案 12 :(得分:-2)

许多人问这个问题,没有人想出一个满意的答案。这是一个std :: sort助手,它可以同时对两个向量进行排序,只考虑一个向量的值。此解决方案基于自定义RadomIt(随机迭代器),并直接在原始矢量数据上运行,无需临时副本,结构重新排列或其他索引:

C++, Sort One Vector Based On Another One