AVX 256位等效于_mm_load1_ps

时间:2013-06-13 23:59:06

标签: simd intrinsics avx

使用SSE,你可以将一个浮点数从内存加载到__m128的所有4个插槽中,内置_mm_load1_ps()

当使用带有AVX的256位宽SIMD时,似乎没有_mm256_load1_ps()将单个浮点数从内存加载到向量的所有8个插槽中。

为什么会出现这种遗漏,以及最好的解决方法是什么?

甚至更好:有没有办法将单个浮点数加载到向量的目标插槽0..7?

1 个答案:

答案 0 :(得分:11)

_mm256_broadcast_ss正是您要找的。