nvidia-smi

2024-02-01

nvidia-smi 是 Nvidia 提供的用于管理 GPU 的命令行工具。

安装

如果不知道安装哪个版本的 nvidia-driver,可以通过 [[ubuntu-drivers]] 命令查看推荐的驱动版本,然后再进行安装:

Terminal window
# 查询推荐的版本
ubuntu-drivers devices
# 安装推荐的版本
sudo apt-get install nvidia-driver-750 -y
# 重启
sudo reboot

注: 在 [[Ubuntu]] 中输入 nvidia-smi 时,如果未安装,会提示让安装 nvidia-utils-570,这个其实是 Nvidia 相关的命令行工具,安装 nvidia-driver 时会作为依赖被安装。

参数

  • -pm: 设置持久模式
    • 0: 禁用持久模式
    • 1: 启用持久模式

使用

查看 GPU 使用情况:

Terminal window
nvidia-smi

查看 GPU 使用情况,并每秒刷新一次:

Terminal window
watch -n 1 nvidia-smi

设置持久模式

启用持久模式,即使没有应用程序在使用,也让 GPU 驱动一直保持加载状态,避免每次启动时都重新加载驱动:

Terminal window
# 查看当前是否持久模式
nvidia-smi -q | grep -E 'Persistence Mode'
# 启用持久模式
nvidia-smi -pm 1

字段说明

nvidia-smi 命令输出参数说明:

  • Volatile GPU-Util: GPU 利用率(动态变化)

问题

Failed to initialize NVML: Driver/library version mismatch

参考