SIMD聚集和插入有什么区别?

时间:2017-05-11 06:10:03

标签: performance memory architecture vectorization simd

AFAK,gatherinsert指令都是为了将​​不连续的数据元素从内存加载到向量寄存器而设计的,但我发现许多论文都将gather技术作为一种更有效的方式打包不连续的元素。

insert很容易理解:发出多个标量加载uops,并将相应的数据元素逐个加载到向量寄存器中;

gather需要base_addrindex的向量,该向量会添加到base_addr以指示要加载的元素。

gather是如何实现的,是否会将多个加载uops作为insert发出?什么导致与insert相比的性能差异?

0 个答案:

没有答案