Question

unsigned int lookup_bloom(unsigned char (*id)[HEXXID], unsigned int len,
        void *bf)
{
    int i;
    struct bloom_structure *filter = (struct bloom_structure *) bf;
    unsigned int *nexthop = NULL;
    // The returned values of counting_bloom_check() are 0 if found else 1
    unsigned char matchvec[WDIST] = {1};
    unsigned char tmp1[HEXXID + 1] = {0};
    unsigned char tmp2[HEXXID] = {0};

    memcpy(tmp1, id, HEXXID);
    memcpy(tmp2, tmp2, HEXXID);
    // Although the paper suggests to perform parallel membership queries
    for (i = len; i >= MINLENGTH; i--) {
        tmp1[i / BYTE] = tmp1[i / BYTE] >> (BYTE - i % BYTE) <<
                            (BYTE - i % BYTE);
        if (!filter->flag[i - MINLENGTH])
            continue;
        matchvec[i - MINLENGTH] =
        counting_bloom_check(filter->bloom[i - MINLENGTH], tmp1,
                                HEXXID);
    }
    // Parse the matchvec from longest to shortest to perform table search
    for (i = len; i >= MINLENGTH; i--) {
        tmp2[i / BYTE] = tmp2[i / BYTE] >> (BYTE - i % BYTE) <<
                            (BYTE - i % BYTE);
        if (matchvec[i - MINLENGTH] || !filter->flag[i - MINLENGTH])
            continue;
        nexthop = hashit_lookup(filter->hashtable[i - MINLENGTH],
                    tmp2);
        if (nexthop)
            return *nexthop;
    }

    return 0;
}

以下是代码中使用的一些定义：

#define WDIST 140
#define MINLENGTH 20

struct bloom_structure {
    bool flag[WDIST];
    unsigned int length[WDIST];
    int low[WDIST];
    int high[WDIST];
    counting_bloom_t *bloom[WDIST];
    hash_t hashtable[WDIST];
};

我正在测量执行此功能的时间。有人可以帮助我优化这个例程吗？

如果有人可以建议任何更改来编写循环以减少执行时间，那就太棒了。

提前谢谢你！

Answer 1

根据此功能的重要程度，您可以尝试最小化执行的分区数（/和％），因为它们是CPU最昂贵的操作。

您可以合并两个循环，因为它们使用相同的范围。这样，您就可以在变量中使用相同的索引计算（暗示除法的那些）。

如果你真的想推动它，你可以预先计算所有意味着除法计算的索引，以便从数组或任何认为合适的容器中访问这些值。

我对此函数进行了哪些更改以优化执行时间？

1 个答案: