如何计算cudaMallocPitch分配的内存(以字节为单位)

时间:2016-12-07 19:37:59

标签: cuda

如何获取cudaMallocPitch分配的总内存(以字节为单位)?我需要通过库(Nvidia的NCCL)将这些数据发送到另一个gpu,它需要一个基本指针和字节数。我知道用于复制的cudaMemcpy2D函数,遗憾的是我无法使用。

1 个答案:

答案 0 :(得分:4)

cudaMallocPitch以字节为单位返回分配的间距。所以,如果你这样称呼它:

void *devPtr;
size_t pitch;
cudaMallocPitch ( &devPtr, &pitch, width, height );

内存分配的大小为pitch * height个字节。

相关问题