【cuda】Nsight System 下载,安装与使用
nsys是 NVIDIA Nsight Systems 的命令行工具,可以用于分析 CUDA 应用程序的性能和行为。以下是在 Linux 上安装nsys。
Nsight System 下载
nsys 是 NVIDIA Nsight Systems 的命令行工具,可以用于分析 CUDA 应用程序的性能和行为。以下是在 Linux 上安装 nsys 的步骤:
- 下载 NVIDIA Nsight Systems 安装程序。您可以在 NVIDIA 的官方网站上下载适用于您的系统的安装程序。下载地址为:https://developer.nvidia.com/nsight-systems。
Nsight System 安装
-
安装 NVIDIA Nsight Systems。下载完成后,在终端中进入安装程序所在的目录,并执行以下命令以启动安装程序:
chmod +x <installer-name>.run ./<installer-name>.run这将启动安装程序。您可以按照屏幕上的提示进行安装。
-
添加
nsys到系统的 PATH 环境变量中。为了能够在终端中直接使用nsys命令,您需要将安装目录中的bin文件夹添加到系统的 PATH 环境变量中。可以使用以下命令将nsys添加到 PATH 环境变量中:export PATH="/usr/local/cuda/Nsight_Systems_2021.4.1/bin:$PATH"在这个命令中,
/usr/local/cuda/Nsight_Systems_2021.4.1/bin是nsys的安装路径,您需要将其替换为您的实际安装路径。
现在,您应该已经成功安装了 nsys 命令行工具。可以在终端中输入 nsys help 命令来查看所有可用的命令和选项。
Nsight System 调试
nsys profile python main.py
然后就会生成report1.qdstrm和report1.sqlite两个文件,将report1.qdstrm转换为report1.qdrep文件:
QdstrmImporter -i report1.qdstrm
最后将生成的 report1.qdrep 文件用 Nsight Systems 软件打开。
参考:https://blog.51cto.com/godweiyang/5516905
封面图:https://space.bilibili.com/189025925
欢迎来到FlagOS开发社区,这里是一个汇聚了AI开发者、数据科学家、机器学习爱好者以及业界专家的活力平台。我们致力于成为业内领先的Triton技术交流与应用分享的殿堂,为推动人工智能技术的普及与深化应用贡献力量。
更多推荐
所有评论(0)