所以,如果我想在两个GPU之间进行统一虚拟地址(UVA)复制(使用带有类型参数的cudaMemcpyAsync是cudaMemcopyDefault),我应该使用哪个流?源内存的设备流?或指定记忆的开发流?
谢谢
答案 0 :(得分:2)
建议:改用cudaMemcpyPeerAsync。请参阅this question作为示例。
我想回答你的问题,from here:
流和事件行为
如果将内核启动或内存复制发布到流,则它将失败 与当前设备无关的
因此,请选择与您最近进行的cudaSetDevice()
来电相对应的设备流。