优先队列错误订单

时间:2010-03-03 16:41:37

标签: c++ priority-queue huffman-code

我正在编写霍夫曼编码。这是我的计划的开始:

using namespace std;

//Counting methods
int *CountCharOccurence(string text)
{
    int *charOccurrence = new int[127];
    for(int i = 0; i < text.length(); i++)
    {
        charOccurrence[text[i]]++;
    }
    return charOccurrence;
}

void DisplayCharOccurence(int *charOccurrence)
{
    for(int i = 0; i < 127; i++)
    {
        if(charOccurrence[i] > 0)
        {
            cout << (char)i << ": " << charOccurrence[i] << endl;
        }
    }
}

//Node struct
struct Node
{
    public:
        char character;
        int occurrence;

        Node(char c, int occ) {
            character = c;
            occurrence = occ;
        }

        bool operator < (const Node* node)
        {
            return (occurrence < node->occurrence);
        }
};

void CreateHuffmanTree(int *charOccurrence)
{
    priority_queue<Node*, vector<Node*> > pq;
    for(int i = 0; i < 127; i++)
    {
        if(charOccurrence[i])
        {
            Node* node = new Node((char)i, charOccurrence[i]);
            pq.push(node);
        }
    }

    //Test
    while(!pq.empty())
    {
        cout << "peek: " << pq.top()->character <<  pq.top()->occurrence << endl;
        pq.pop();
    }
}

int main(int argc, char** argv) {

    int *occurrenceArray;
    occurrenceArray = CountCharOccurence("SUSIE SAYS IT IS EASY");
    DisplayCharOccurence(occurrenceArray);
    CreateHuffmanTree(occurrenceArray);

    return (EXIT_SUCCESS);
}

程序首先输出带有出现次数的字符。这看起来很好:

 : 4
A: 2
E: 2
I: 3
S: 6
T: 1
U: 1
Y: 2

但必须以优先级顺序显示节点内容的测试循环输出:

peek: Y2
peek: U1
peek: S6
peek: T1
peek: I3
peek: E2
peek:  4
peek: A2

这不是预期的顺序。为什么呢?

3 个答案:

答案 0 :(得分:5)

优先级队列中的元素是指针。由于您没有提供带有2个指向Node对象的函数,因此默认比较函数会比较2个指针。

bool compareNodes(Node* val1, Node* val2)
{
   return val1->occurence < val2->occurence;
}
priority_queue<Node*, vector<Node*>,compareNodes > pq;

您的运营商&lt; Node与Node *

比较时使用

答案 1 :(得分:1)

您应该告诉您的优先级队列应该排序的内容。在您的情况下,您必须告诉它按Node::occurence排序。

答案 2 :(得分:1)

您正在存储指向队列中节点的指针,但尚未提供合适的比较函数,因此通过比较指针对它们进行排序。您提供的operator<会将节点与指针进行比较,这不是您想要的。

有两种选择:

  • 提供一个函数,用于根据它们的值比较两个节点指针,并将此函数提供给队列,或
  • 将节点对象存储在队列中,并提供operator<来比较两个节点。

第二个选项也会修复代码中的内存泄漏,并删除一堆不必要的内存分配,所以我建议。