标签: opencl
由于OpenCL程序在几台具有特定架构的机器上运行,因此我想到如何编写程序以在这些机器上获得最佳平均性能。
我很高兴听到你的建议:)
由于
答案 0 :(得分:6)
我的供应商无关的OpenCL优化建议,按顺序:
内存访问
计算
主持人
祝你好运,玩得开心,并对你的目标硬件进行基准测试,以确保你的优化在所有硬件上都是积极的,而不是在某些硬件上回归。