CUB(CUDA Unbound)库说明
CUB 是 NVIDIA 提供的 header-only CUDA 协作原语库,为 GPU kernel 提供 block / warp / device 级别的并行算法组件。
官方仓库已并入 nvidia/cccl;
一、功能与作用
CUB 解决的核心问题:不必手写 warp shuffle、shared memory 归约、多 pass 排序等底层 CUDA 细节,直接调用高度优化的模板组件。
在 CUDA 软件栈中的位置:
应用 Kernel(业务逻辑)
↑
CUB 协作原语(Block / Warp / Device)
↑
CUDA Runtime / PTX / 硬件
四层能力
| 层级 | 头文件目录 | 典型能力 |
|---|---|---|
| Device-wide | cub/device/ |
全数组 reduce、scan、sort |

订阅专栏 解锁全文
362

被折叠的 条评论
为什么被折叠?



