当前位置 : 主页 > 网络安全 > 测试自动化 >

CUDA块大小1024×1与32×32会有任何性能差异吗?

来源:互联网 收集:自由互联 发布时间:2021-06-22
从线程调度和内存带宽的角度来看,这两个块大小(1024×1对32×32)是如何实现的?这2个块大小的性能是否有任何预期的差异?请注意,每个块使用1024个线程. Threadblock维度,特别是当我们讨论
从线程调度和内存带宽的角度来看,这两个块大小(1024×1对32×32)是如何实现的?这2个块大小的性能是否有任何预期的差异?请注意,每个块使用1024个线程. Threadblock维度,特别是当我们讨论每个块的相同数量的线程时,它们本身不会影响性能.

线程仍然是grouped for execution into warps.线程块尺寸的唯一直接影响是更改内置变量,例如传递给每个线程的threadIdx.x,blockIdx.x等,这不是性能问题.

网友评论