在KNL(Xeon Phi 7210)上将16位掩码(__mmask16)转换为__m128i控制字节掩码

时间:2016-11-02 23:51:04

标签: xeon-phi avx512

我希望在 __ mmask16 __ m128i 之间进行转换。但是,已发布在https://stackoverflow.com/a/32247779/6889542

/* convert 16 bit mask to __m128i control byte mask */
_mm_maskz_broadcastb_epi8((__mmask16)mask,_mm_set1_epi32(~0))

_mm_maskz_broadcastb_epi8 以及类似的东西在KNL上还没有。 KNL (Xeon Phi 7210)上缺少 AVX512BW 对我来说真的很头疼。

问题的根源是我希望利用

_mm_maskmoveu_si128 (__m128i a, __m128i mask, char* mem_addr)

使用

__mmask16 len2mask[] = { 0x0000, 0x0001, 0x0003, 0x0007,
                         0x000F, 0x001F, 0x003F, 0x007F,
                         0x00FF, 0x01FF, 0x03FF, 0x07FF,
                         0x0FFF, 0x1FFF, 0x3FFF, 0x7FFF,
                         0xFFFF };

1 个答案:

答案 0 :(得分:0)

如果您实际上打算生成类似这样的内容:

__m128i mask = _mm_maskz_broadcastb_epi8(len2mask[length],_mm_set1_epi32(~0))

为什么不只是:

void foo(int length, char* mem_addr, const __m128i a)
{
    __m128i count = _mm_set_epi8(15,14,13,12,11,10,9,8,7,6,5,4,3,2,1,0);
    __m128i mask = _mm_cmpgt_epi8(_mm_set1_epi8(length), count);
    _mm_maskmoveu_si128 (a, mask, mem_addr);
}

Godbolt demonstration

相关问题