首先要保证使用的显卡的计算功能集(计算能力)在1.1以上,因为只有1.1或者更高版本的GPU计算功能集才能支持全局内存上的原子操作;此外,只有1.2或者更高版本的GPU计算功能集才能支持共享内存上的原子操作。可以在命令行下运行"C:\ProgramData\NVIDIA
Corporation\CUDA
Samples\v5.0\bin\win64\Release\deviceQuery.exe"来查看自己的GPU计算功能集(CUDA Capability Major/Minor version
number)。
对于计算能力1.1.
把所有.cu文件以及项目改为compte_11,sm_11(右击项目--》属性--》CUDA
C/C++--》Device--》Code Generate), 在需要用到原子操作函数的文件头加上#include
sm_11_atomic_functions.h(记得加尖括号) ,那么就可以正确使用对于int的atomicAdd了。
对于计算能力2.0.同理,把所有.cu文件以及项目改为compte_20,sm_20(右击项目--》属性--》CUDA
C/C++--》Device--》Code Generate),
在需要用到原子操作函数的文件头加上#include m_20_atomic_functions.h
(记得加尖括号),那么就可以正确使用对于int和float的atomicAdd了。
本文介绍了解决在VS2010环境下CUDA程序中出现的atomicAdd未定义错误的方法,包括如何根据GPU计算能力调整项目设置及正确包含原子操作函数。

5712

被折叠的 条评论
为什么被折叠?



