你想确认 GPU 是否在被程序使用,可以从几个角度来检查。
下面我给你按“实时监控”和“单次查询”两种方式讲。


方法 1:实时查看 GPU 利用率(推荐)

在终端运行:

watch -n 1 nvidia-smi
  • watch -n 1 表示每秒刷新一次
  • nvidia-smi 会显示 NVIDIA GPU 的使用情况

关键看这几列:

  • GPU:GPU 编号(如果有多张显卡)
  • Memory-Usage:显存使用量
  • GPU-Util:GPU 利用率(百分比)
  • Processes:正在使用 GPU 的进程及占用显存

如果 GPU-Util > 0% 且 Memory-Usage 在增加,说明程序正在用 GPU。


方法 2:单次查询 GPU 状态

nvidia-smi

它会显示当前瞬间的 GPU 状态,适合快速检查。


方法 3:用 PyTorch 查看是否在用 GPU

如果你的程序是用 PyTorch 写的,可以在代码里或终端里检查:

python -c "import torch; print('GPU 可用:', torch.cuda.is_available()); print('当前使用 GPU:', torch.cuda.get_device_name(0) if torch.cuda.is_available() else '无')"

运行中可以随时查看:

import torch
print(torch.cuda.memory_allocated())  # 当前分配的显存
print(torch.cuda.memory_reserved())   # 当前缓存的显存

方法 4:查看系统进程占用 GPU

nvidia-smi -q | grep -A 5 "Processes"

会列出所有占用 GPU 的进程 ID、用户名、显存占用等。


方法 5:使用更详细的监控工具

  • nvitop(类似 top 但专用于 GPU)

    pip install nvitop
    nvitop

    界面更直观,可以看到实时显存、利用率、温度等。


出现 sudo: ubuntu-drivers: command not found 是因为你的 Ubuntu 系统缺少 ubuntu-drivers-common 这个工具包(它是用来管理 NVIDIA 驱动的官方工具)。

先补装这个工具,再继续安装驱动即可,步骤很简单:

1. 先安装 ubuntu-drivers-common 工具

sudo apt update
sudo apt install -y ubuntu-drivers-common
  • apt update 会更新软件源列表,确保能找到最新的工具包;
  • apt install -y 会自动确认安装,不用手动输入 Y

2. 检查工具是否安装成功

ubuntu-drivers --version

如果能显示版本号(比如 ubuntu-drivers 1:0.9.0.1),说明工具已可用。

3. 继续安装 NVIDIA 驱动(和之前步骤一致)

方法 1:自动检测并安装(推荐)

sudo ubuntu-drivers autoinstall

系统会自动识别你 GPU(Device 2684)适配的最新稳定驱动,一键安装。

方法 2:手动选择驱动(备选)

先查看可用驱动列表:

ubuntu-drivers devices

会输出类似这样的内容(重点看 recommended 标记的驱动):

== /sys/devices/pci0000:00/0000:00:03.0 ==
modalias : pci:v000010DEd00002684sv000010DEsd00001470bc03sc00i00
vendor   : NVIDIA Corporation
model    : Device 2684
driver   : nvidia-driver-550 - distro non-free recommended  # 推荐安装这个
driver   : nvidia-driver-545 - distro non-free
driver   : xserver-xorg-video-nouveau - distro free builtin

然后安装带 recommended 的驱动(比如 550):

sudo apt install -y nvidia-driver-550

4. 重启系统让驱动生效

sudo reboot

5. 验证驱动是否正常

重启后执行:

nvidia-smi

如果能看到 GPU 信息、驱动版本(比如 550.xx.xx)和 CUDA Version(12.4),说明驱动安装成功。

之后再按之前的步骤重新安装 PyTorch,torch.cuda.is_available() 就会返回 Truewebui.py 也能正常调用 GPU 了。

如果中间遇到任何报错(比如安装工具时提示依赖问题),随时告诉我,我帮你解决。

标签: none

添加新评论