目录
Win 10 CUDA 安装提示Visual Studio Intergration安装失败
Win 10 CUDA 安装提示不能创建chrome_elf.dll
英伟达30系显卡和CUDA
我的显卡是3060ti,应安装CUDA 11以上
虽然安装CUDA 10不会报错(可以正常安装),但在使用TensorFlow、Keras训练模型时会报错
比如使用TensorFlow+Keras训练时卡在第一个Epoch不动
比如使用TensorFlow训练时报错:failed to run cuBLAS routine: CUBLAS_STATUS_EXECUTION_FAILED
Windows 11装多个CUDA
一个个装,装完之后环境变量里看看配了没有
选自定义,只装CUDA相关的即可,不用全装
Win 11也可以装CUDA 10.0(下载Win10的版本)
Win 10 CUDA 安装提示Visual Studio Intergration安装失败
选自定义安装
不要安装Visual Studio Intergration(不要打勾)
这样的方法不影响TensorFlow等的使用
Win 10 CUDA 安装提示不能创建chrome_elf.dll
把360安全卫士关了/卸了
其他
现在的GPU都采用了多层次线程技术,按照硬件开发商提供的文档,对应SIMD Lane,OpenCL中称作work-item,在图形渲染的时候你可以将其看作是屏幕上的一个像素,是最小的线程单位;
往上的一层线程单位在新的OpenCL被称作sub-group,属于GPU执行调度的最小硬件线程单位。再往上就是workgroup和NDRange
Workgroup的对应GPU硬件关系是Compute Unit,同一时间里Compute Unit跑的都是一个workgroup,而Grid则对应GPU的一个partition(分区,在设备或者说加速器允许的情况下,OpenCL可以把一个设备分成若干个分区来使用)。
你可以把饭粒比作是work-item,而每一口饭则算是一个sub-group,一碗饭看作是一个 workgroup,饭煲看作是NDRange
查看GPU连续使用情况 windows
命令行模式下进入C:\Program Files\NVIDIA Corporation\NVSMI
使用: nvidia-smi.exe -l 必须是小写的l, -l 指定数字表示每个几秒刷新显示
ROCm
AMD ROCm is the first open-source software development platform for HPC/Hyperscale-class GPU computing. AMD ROCm brings the UNIX philosophy of choice, minimalism and modular software development to GPU computing.

5725

被折叠的 条评论
为什么被折叠?



