📌  相关文章
📜  linux 检查 gpu 使用情况 - Shell-Bash (1)

📅  最后修改于: 2023-12-03 15:02:44.683000             🧑  作者: Mango

Linux 检查 GPU 使用情况 - Shell-Bash

简介

如果你是一名程序员或者数据科学家,你可能需要使用到 GPU 来加速计算任务。但是在使用 GPU 的过程中,你需要时刻关注 GPU 的使用情况,以便及时调整计算任务,以避免 GPU 资源的浪费。本文将介绍如何使用 Shell-Bash 命令行工具来检查 GPU 的使用情况。

检查 GPU 的使用情况

我们可以使用 nvidia-smi 命令来检查 GPU 的使用情况。该命令是 Nvidia 显卡驱动安装程序自带的一个命令,可以用于监测 Nvidia 显卡的状态。

nvidia-smi

该命令将会显示如下的信息:

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 470.63.01    Driver Version: 470.63.01    CUDA Version: 11.4     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  NVIDIA GeForce ...  Off  | 00000000:01:00.0  On |                  N/A |
|  0%   45C    P8     4W / 210W |    245MiB /  7979MiB |      3%   E. Process |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
|   1  NVIDIA GeForce ...  Off  | 00000000:05:00.0 Off |                  N/A |
| 48%   79C    P0   153W / 230W |  10130MiB / 10016MiB |    100%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
|   2  NVIDIA GeForce ...  Off  | 00000000:08:00.0 Off |                  N/A |
| 30%   64C    P0    56W / 250W |      0MiB / 19138MiB |     19%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+
|   3  NVIDIA GeForce ...  Off  | 00000000:09:00.0 Off |                  N/A |
| 30%   40C    P0    14W / 250W |   1712MiB / 12050MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+

可以看到,该命令显示了所有的 GPU 设备的状态信息,包括了 GPU 设备的名称、GPU 设备的使用率、GPU 设备的温度、GPU 设备的电源使用情况、GPU 设备上正在运行的进程等等。你可以选择根据自己的需求检查相应的信息。

检查单一 GPU 设备的使用情况

如果你只需要检查单一 GPU 设备的使用情况,你可以使用以下命令:

nvidia-smi --id=<gpu_id>

其中,<gpu_id> 为 GPU 设备的 ID 号,可以是一个非负整数。例如,如果你需要检查 ID 号为 0 的 GPU 设备的使用情况,你可以使用以下命令:

nvidia-smi --id=0
检查所有 GPU 设备的使用情况

如果你需要检查所有的 GPU 设备的使用情况,你可以使用以下命令:

nvidia-smi -a
结论

在本文中,我们介绍了如何使用 Shell-Bash 命令行工具来检查 GPU 的使用情况,包括如何检查单一 GPU 设备的使用情况,以及如何检查所有 GPU 设备的使用情况。通过使用这些命令,你可以及时地监测 GPU 的使用情况,以便更好地调整计算任务,以避免 GPU 资源的浪费。