Kubernetes 上の GPU サービス
FPT Cloud の Managed Kubernetes Engine(M-FKE)は、GPU ワークロードをサポートします。GPU ノードを含むワーカーグループを設定することで、機械学習、ディープラーニング、データサイエンスなどのワークロードを GPU で実行できます。
GPU ワーカーグループの設定
GPU を使用するには、GPU フレーバーを持つワーカーグループを作成する必要があります。クラスター作成時またはワーカーグループ追加時に GPU フレーバーを選択します。
GPU リソースの要求
Kubernetes での GPU リソースの要求は、通常のリソース要求と同様に行います。Pod の spec に nvidia.com/gpu リソースを指定します。
apiVersion: v1
kind: Pod
metadata:
name: gpu-pod
spec:
containers:
- name: gpu-container
image: nvidia/cuda:11.0-base
resources:
limits:
nvidia.com/gpu: 1
GPU の確認
クラスター内の GPU ノードを確認するには、以下のコマンドを使用します。
kubectl get nodes -o json | jq '.items[].status.capacity'
GPU が正しく認識されている場合、nvidia.com/gpu フィールドが表示されます。
注意事項
- GPU リソースは整数値のみ指定できます(分数指定は GPU Sharing 機能を使用してください)。
- GPU ノードには適切な NVIDIA ドライバーが事前にインストールされています。
- GPU ワークロードに適した namespace を使用することを推奨します。
詳細については、GPU Sharing のドキュメントも参照してください。