使用具有小模式的SSE4.2指令PCMPESTRM

时间:2016-10-21 17:46:50

标签: c++ string-matching sse4

我试图在字符串匹配算法中使用一些SSE4.2 intructions,用c ++编码。

我不明白如何使用这些说明来匹配较小的模式,并希望有人可以帮助我。

在代码示例中,我试图在打包字符串“我是羚羊”中找到模式“ant”。我希望结果是一个设置为全零的掩码,除了索引8处的1。

现在这是我的代码,其中包含#include for nmmintrin.h以包含sse4.2指令:

void print128_num(__m128i var)
{
    uint8_t *val = (uint8_t*) &var;
    printf("Text: %i %i %i %i %i %i %i %i %i %i %i %i %i %i %i %i \n", 
           val[0], val[1], val[2], val[3], val[4], val[5], 
           val[6], val[7], val[8], val[9], val[10], val[11],
           val[12], val[13], val[14], val[15]);
}

int main(){

    __m128i s = _mm_set_epi8('e','p','o','l','e','t','n','a',' ','n','a',' ','m','a',' ','i');
    __m128i p = _mm_set_epi8(0,0,0,0,0,0,0,0,0,0,0,0,0,'t','n','a');

    print128_num(s);
    print128_num(p);

    __m128i res =  _mm_cmpestrm(s, 16, p, 3, 0);
    print128_num(res);

    return 0;
}

我添加了所有零,因为初始化函数不允许更少的参数。我意识到这是错误的,但不知道该怎么做,并做了几次非常绝望的尝试。

无论如何这就是我编译的方式:g ++ -g sse4test.cpp -o sse4test -std = c ++ 11 -msse4.2

这是我的输出:

Text: 105 32 97 109 32 97 110 32 97 110 116 101 108 111 112 101 
Text: 97 110 116 0 0 0 0 0 0 0 0 0 0 0 0 0 
Text: 7 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 

我真的不明白。 (最后一行)。

非常感谢任何帮助。

1 个答案:

答案 0 :(得分:2)

您的代码存在两个问题。首先,您在_mm_cmpestrm的调用中反转了模式。其次,您为最后一个参数指定0,这是一组指定操作模式的标志。

零模式以_SIDD_CMP_EQUAL_ANY形式出现,描述为For each character c in A, determine whether any character in B is equal to c.

对于子字符串搜索,模式应指定为_SIDD_UBYTE_OPS | _SIDD_CMP_EQUAL_ORDERED | _SIDD_BIT_MASK

如果您进行了这些更改,则输出为" 0 1"或换句话说,匹配第9个字符。

BTW:您可以使用_mm_loadu_si128((__m128i*)(str));而非使用_mm_set_epi8从字符串加载。