2024/11/25 Updated by
Ubuntu Docker Image on Windows (GPU)
[Up]
前提条件
- Docker on Windows (GPU) の手順にしたがって、
nVidia のGPUを備えた Windows 11 マシンに docker Host がインストールされている。
- Windows 上に Ubuntu (WSL2) がインストールされていて、そのうえで
dodkr コマンド を実行できる。
- Ubuntu (WSL2) 上で nvidia-smi コマンドが実行できる。
$ nvidia-smi
nitta@galleria:~$ nvidia-smi
Mon Nov 25 14:42:14 2024
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 565.72 Driver Version: 566.14 CUDA Version: 12.7 |
|-----------------------------------------+------------------------+----------------------+
| GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|=========================================+========================+======================|
| 0 NVIDIA GeForce GTX 980M On | 00000000:01:00.0 On | N/A |
| N/A 57C P0 26W / 1000W | 866MiB / 8192MiB | 0% Default |
| | | N/A |
+-----------------------------------------+------------------------+----------------------+
+-----------------------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=========================================================================================|
| 0 N/A N/A 26 G /Xwayland N/A |
| 0 N/A N/A 35 G /Xwayland N/A |
| 0 N/A N/A 41 G /Xwayland N/A |
+-----------------------------------------------------------------------------------------+
Ubuntu (WSL2) 上から、cuDNN のバージョンを調べるために nvcc をインストールしようとすると失敗する。なぜ?
$ nvcc --version ←これを起動したいが、コマンドがないと出力されて、インストール方法が提示される。
Command 'nvcc' not found, but can be installed with:
sudo apt install nvidia-cuda-toolkit
$ sudo apt install nvidai-cuda-toolkit ← 指示にしたがってインストールコマンドを実行するが、エラーとなり失敗する。
エラー
特定のバージョンの TensorFlow (GPU) を使うための docker guest を用意する
- nVidia 公式 Web サイト上にある
NGC コンテナー User Guide
」を参照する。
- nvidia-docker の image の各リリースは「バージョンタグ」で表される。
- NGC コンテナ レジストリ空間
nvcr.io/nvidia ... nVidia GPU (single and multi) を 活用するコンテナ
nvcr.io/nvidia-hpcvis ... HPC 視覚化コンテナ
nvcr.io/hpc ... パートナー各社から提供されているサードバーティ製 HPC アプリケーションコンテナ
- 前提条件
- コンテナイメージは NGC Catalog で選択する。
左のメニューから Containers を選択し、"NVIDIA Platform" で TensorFlow にチェックをつける。
docker run --gpus all -it --rm -v local_dir:container_dir nvcr.io/nvidia/tensorflow:xx.xx-tf2-py3
- tensorflow のコンテナに関して、全リストが見たければ
TensorFlow Release Notes
を参照する。
TensorFlow Release のバージョンタグはは "年.月" を意味する。
たとえば 17.01 は 2017年1月にリリースされたことを意味する
TensorFlow (GPU) の docker イメージ一覧
-
探しているのは tensorflow2.13, cuda 11.8,cuDNN 8.6。
23.08, 23.09, 23.10 を使えばよいことがわかる。
TensorFlow
Release TensorFlow CUDA cuDNN Ubuntu Python
24.11 2.17.0 12.6.3 9.5.1.17 22.04 3.10.6
24.10 2.16.1 12.6.2 8.9.7.29 22.04 3.10.6
24.09 2.16.1 12.6.1 8.9.7.29 22.04 3.10.6
24.08 2.16.1 12.6 8.9.7.29 22.04 3.10.6
24.07 2.16.1 12.5.1 8.9.7.29 22.04 3.10.6
24.06 2.16.1 12.5.0.23 8.9.7.29 22.04 3.10.6
24.05 2.15.0 12.4.1 8.9.7.29 22.04 3.10.6
24.04 2.15.0 12.4.1 8.9.7.29 22.04 3.10.6
24.03 2.15.0 12.4.0.41 8.9.7.29 22.04 3.10.6
24.02 2.15.0 12.3.2 8.9.7.29 22.04 3.10.6
24.01 2.14.0 12.3.2 8.9.7.29 22.04 3.10.6
23.12 2.14.0 12.3.2 8.9.7.29 22.04 3.10.6
23.11 2.14.0 12.3.0 8.9.6 22.04 3.10.6
23.10 2.13.0 12.2.2 8.9.5 22.04 3.10.6
23.09 2.13.0 12.2.1 8.9.5 22.04 3.10.6
23.08 2.13.0 12.2.1 8.9.4 20.04 3.10.6
23.07 2.12.0 12.1.1 8.9.3 20.04 3.10.6
23.02 2.11.0 12.0.1 8.7.0 20.04
22.11 2.10.0 11.8.0 8.7.0 20.04
22.09 2.9.1 11.8.0 8.6.0.163 20.04 3.8
22.08 2.9.1 11.7.1 8.5.0.96 20.04 3.8
- "TensorFlow Release 23.09" をインストールするためには、
"WSL2 のUbuntu"から以下のコマンドを実行する。
docker run --shm-size=1g \
--ulimit memlock=-1 \
--ulimit stack=67108864 \
--gpus all \
-p 8888:8888 \
-it nvcr.io/nvidia/tensorflow:23.09-tf2-py3