📅  最后修改于: 2023-12-03 15:02:44.683000             🧑  作者: Mango
如果你是一名程序员或者数据科学家,你可能需要使用到 GPU 来加速计算任务。但是在使用 GPU 的过程中,你需要时刻关注 GPU 的使用情况,以便及时调整计算任务,以避免 GPU 资源的浪费。本文将介绍如何使用 Shell-Bash 命令行工具来检查 GPU 的使用情况。
我们可以使用 nvidia-smi 命令来检查 GPU 的使用情况。该命令是 Nvidia 显卡驱动安装程序自带的一个命令,可以用于监测 Nvidia 显卡的状态。
nvidia-smi
该命令将会显示如下的信息:
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 470.63.01 Driver Version: 470.63.01 CUDA Version: 11.4 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 NVIDIA GeForce ... Off | 00000000:01:00.0 On | N/A |
| 0% 45C P8 4W / 210W | 245MiB / 7979MiB | 3% E. Process |
| | | N/A |
+-------------------------------+----------------------+----------------------+
| 1 NVIDIA GeForce ... Off | 00000000:05:00.0 Off | N/A |
| 48% 79C P0 153W / 230W | 10130MiB / 10016MiB | 100% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
| 2 NVIDIA GeForce ... Off | 00000000:08:00.0 Off | N/A |
| 30% 64C P0 56W / 250W | 0MiB / 19138MiB | 19% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
| 3 NVIDIA GeForce ... Off | 00000000:09:00.0 Off | N/A |
| 30% 40C P0 14W / 250W | 1712MiB / 12050MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
可以看到,该命令显示了所有的 GPU 设备的状态信息,包括了 GPU 设备的名称、GPU 设备的使用率、GPU 设备的温度、GPU 设备的电源使用情况、GPU 设备上正在运行的进程等等。你可以选择根据自己的需求检查相应的信息。
如果你只需要检查单一 GPU 设备的使用情况,你可以使用以下命令:
nvidia-smi --id=<gpu_id>
其中,<gpu_id> 为 GPU 设备的 ID 号,可以是一个非负整数。例如,如果你需要检查 ID 号为 0 的 GPU 设备的使用情况,你可以使用以下命令:
nvidia-smi --id=0
如果你需要检查所有的 GPU 设备的使用情况,你可以使用以下命令:
nvidia-smi -a
在本文中,我们介绍了如何使用 Shell-Bash 命令行工具来检查 GPU 的使用情况,包括如何检查单一 GPU 设备的使用情况,以及如何检查所有 GPU 设备的使用情况。通过使用这些命令,你可以及时地监测 GPU 的使用情况,以便更好地调整计算任务,以避免 GPU 资源的浪费。