Volta与并发内核共享的内存大小

时间:2018-08-10 00:46:37

标签: cuda gpu

CUDA手册(9.2)指出,对于7.0功能,“共享内存从128 KB数据缓存中进行分区,可以配置为0、8、16、32、64或96 KB”。

此函数为内核设置“雕刻”共享内存的数量:

cudaFuncSetAttribute(MyKernel, cudaFuncAttributePreferredSharedMemoryCarveout, carveout);

当多个内核同时执行,每个SM超过一个内核并且这些内核具有不同的分割时,会发生什么?是否将每个特定SM上运行的内核的分割总数相加,并在每个SM上使用总计? 如果分位数的总和不是8、16、32、64、96之一,则将其四舍五入吗?

0 个答案:

没有答案