在Alea.GPU中传递超过16个内核参数

时间:2015-03-20 11:44:35

标签: c# .net gpu aleagpu

我有一个相当复杂的内核,我正在尝试编写。事实证明,我需要传递超过16个参数,显然Alea GPU对16个参数有限制。 (http://quantalea.com/static/app/manual/reference/alea_cuda_il/alea-cuda-il-ilgpumodule.html

我知道16个参数听起来像个坏主意......还有其他选择吗?在普通代码中,我当然会将这些东西包装到它自己的类中,但是我可以在GPU代码中做些什么呢?

1 个答案:

答案 0 :(得分:2)

在这种情况下,您可以通过GPUModule.GPUEntities属性检索无类型的内核对象,然后将这些参数放入Object类型的列表中,然后启动它。

你也可以为此目的制作一些扩展方法,并使它们是类型安全的,这里是一个例子,为简单起见我只使用3个参数:

public static class GPUModuleExtensions
{
    public static void MyGPULaunch<T1, T2, T3>(
        this ILGPUModule module,
        Action<T1, T2, T3> kernelD, LaunchParam lp,
        T1 arg1, T2 arg2, T3 arg3)
    {
        // get the kernel object by method name
        var kernel = module.GPUEntities.GetKernel(kernelD.Method.Name).Kernel;
        // create parameter list (which is FSharpList)
        var parameterArray = new object[] {arg1, arg2, arg3};
        var parameterList = ListModule.OfArray(parameterArray);
        // use untyped LaunchRaw to launch the kernel
        kernel.LaunchRaw(lp, parameterList);
    }
}

public class GPUModule : ILGPUModule
{
    public GPUModule() : base(GPUModuleTarget.DefaultWorker)
    {
    }

    [Kernel]
    public void Kernel(deviceptr<int> outputs, int arg1, int arg2)
    {
        var tid = threadIdx.x;
        outputs[tid] = arg1 + arg2;
    }

    [Test]
    public void Test()
    {
        const int n = 32;
        var lp = new LaunchParam(1, n);
        using (var outputs = GPUWorker.Malloc<int>(n))
        {
            this.MyGPULaunch(Kernel, lp, outputs.Ptr, 1, 3);
            Console.WriteLine("{0}", (outputs.Gather())[4]);
        }
    }
}

注意,在此示例中,我使用Action<T1,T2,T3>,但Action类型最多有16种类型,因此您可能需要定义自己的委托以传递超过16种参数类型。