记录踩过的坑-GPU

目录

英伟达30系显卡和CUDA

Windows 11装多个CUDA

Win 10 CUDA 安装提示Visual Studio Intergration安装失败

Win 10 CUDA 安装提示不能创建chrome_elf.dll

其他

查看GPU连续使用情况 windows

ROCm


英伟达30系显卡和CUDA

我的显卡是3060ti,应安装CUDA 11以上

虽然安装CUDA 10不会报错(可以正常安装),但在使用TensorFlow、Keras训练模型时会报错

比如使用TensorFlow+Keras训练时卡在第一个Epoch不动

比如使用TensorFlow训练时报错:failed to run cuBLAS routine: CUBLAS_STATUS_EXECUTION_FAILED

Windows 11装多个CUDA

一个个装,装完之后环境变量里看看配了没有

选自定义,只装CUDA相关的即可,不用全装

Win 11也可以装CUDA 10.0(下载Win10的版本)

Win 10 CUDA 安装提示Visual Studio Intergration安装失败

选自定义安装

不要安装Visual Studio Intergration(不要打勾)

这样的方法不影响TensorFlow等的使用

Win 10 CUDA 安装提示不能创建chrome_elf.dll

把360安全卫士关了/卸了

其他

现在的GPU都采用了多层次线程技术,按照硬件开发商提供的文档,对应SIMD Lane,OpenCL中称作work-item,在图形渲染的时候你可以将其看作是屏幕上的一个像素,是最小的线程单位;

往上的一层线程单位在新的OpenCL被称作sub-group,属于GPU执行调度的最小硬件线程单位。再往上就是workgroup和NDRange

Workgroup的对应GPU硬件关系是Compute Unit,同一时间里Compute Unit跑的都是一个workgroup,而Grid则对应GPU的一个partition(分区,在设备或者说加速器允许的情况下,OpenCL可以把一个设备分成若干个分区来使用)。
你可以把饭粒比作是work-item,而每一口饭则算是一个sub-group,一碗饭看作是一个 workgroup,饭煲看作是NDRange 

查看GPU连续使用情况 windows

命令行模式下进入C:\Program Files\NVIDIA Corporation\NVSMI

使用: nvidia-smi.exe -l 必须是小写的l, -l 指定数字表示每个几秒刷新显示
 

ROCm

AMD ROCm is the first open-source software development platform for HPC/Hyperscale-class GPU computing. AMD ROCm brings the UNIX philosophy of choice, minimalism and modular software development to GPU computing.

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值