使用Pyopencl的gpu中的最佳线程数

时间:2018-06-06 06:37:22

标签: python gpu nvidia pyopencl tesla

当线程数增加超过一定数量时,GPU的速度会呈指数下降吗?

我看到全局数据中其他数组的大小并不重要。我总是分配线程数=正在考虑的数据中的事务数。 对于特斯拉K80,我看到速度指数下降超过30290线程。 如果为true,最佳做法是保持线程数低并迭代数据以获得最佳速度的结果。 如何为GPU找到最佳线程数?

由于

0 个答案:

没有答案