CUDA程序的最大大小

时间:2019-03-11 01:17:09

标签: cuda ptx

我没有找到有关CUDA PTX源最大大小或执行速度的任何详细信息。

这个想法是让一个程序预写一个大的PTX汇编代码块,该代码块预先包含数据集,以实现非常快速的寄存器访问,并且在其运行期间不会从全局存储器中提取数据。因此,您的数据集将预置为PTX源代码。

1 个答案:

答案 0 :(得分:-1)

编程指南的附录A每个内核引用200万个ptx指令(这是从2010年论坛聊天中获得的-我还没有找到直接引用),因此恕我直言,它绝对可行,并且不需要访问全局内存,加速可以富有戏剧性。

相关问题