Package | Windows10 CUDA10.2 JDK8 环境下安装NVidia Visual Profiler(nvvp)安装Bug笔记

本文介绍如何使用nvprof工具分析CUDA程序的GPU占用情况,并通过NVIDIA Visual Profiler进行可视化。详细步骤包括在Ubuntu环境下生成分析文件,配置Windows环境下的JDK及CUDA库路径以顺利运行nvvp。

 

背景

最近需要具体分析CUDA程序的GPU占用情况。除了使用常见的clock、gettimeofday计时分析程序的效率之外,还可以使用nvidia推出的nvprof进行具体的GPU指令耗时分析,为了方便分析,可以使用nvidia visual profiler对nvprof生成的分析报告进行可视化。

官方链接:https://developer.nvidia.com/nvidia-visual-profiler

 

实验环境

CUDA实验环境是Ubuntu18.04+Titan GPU,同样可以在windows上配置跑CUDA。

可视化工具nvvp的安装环境是Windows10+笔记本自带nvidia显卡。(因为最近都远程2333,所以可视化只能在笔记本了)

 

实验准备

1. 使用Ubuntu环境下的nvprof工具生成待可视化的目标文件。

假设CUDA程序编译通过后得到可执行文件test,使用nvprof运行test程序,记录gpu使用情况并保存为test_prof,输入如下指令:

nvprof -o test_profile ./test

这个过程可能会遇到bug,我的问题描述无法复现(= =),解决方法是关掉unified-memory-profiling即可,指令如下:

nvprof --unified-memory-profiling off -o test_profile ./test

此时,屏幕上会输出该CUDA程序的一些profile统计的文字表格数据,并且在实验环境中保存了nvprof的记录文件test_profile。

&nbs

评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值