标签: cuda
我有一个CUDA应用程序,我在全局内存中有一个大数组(> 1000000浮点数)。如果我使用统一内存语法定义这个数组,那么CUDA是否也会想出通过将数组扩展到共享内存来使程序运行得更快的方法?统一内存架构是否知道使用共享内存而不是全局内存?
答案 0 :(得分:1)
UM与共享内存无关。共享内存仍必须单独显式分配和管理。
您可能希望查看programming guide