メインコンテンツまでスキップ

Kubernetes 上の GPU サービス

FPT Cloud の Managed Kubernetes Engine（M-FKE）は、GPU ワークロードをサポートします。GPU ノードを含むワーカーグループを設定することで、機械学習、ディープラーニング、データサイエンスなどのワークロードを GPU で実行できます。

GPU ワーカーグループの設定

GPU を使用するには、GPU フレーバーを持つワーカーグループを作成する必要があります。クラスター作成時またはワーカーグループ追加時に GPU フレーバーを選択します。

GPU リソースの要求

Kubernetes での GPU リソースの要求は、通常のリソース要求と同様に行います。Pod の spec に nvidia.com/gpu リソースを指定します。

apiVersion: v1
kind: Pod
metadata:
  name: gpu-pod
spec:
  containers:
    - name: gpu-container
      image: nvidia/cuda:11.0-base
      resources:
        limits:
          nvidia.com/gpu: 1

GPU の確認

クラスター内の GPU ノードを確認するには、以下のコマンドを使用します。

kubectl get nodes -o json | jq '.items[].status.capacity'

GPU が正しく認識されている場合、nvidia.com/gpu フィールドが表示されます。

注意事項

GPU リソースは整数値のみ指定できます（分数指定は GPU Sharing 機能を使用してください）。
GPU ノードには適切な NVIDIA ドライバーが事前にインストールされています。
GPU ワークロードに適した namespace を使用することを推奨します。

詳細については、GPU Sharing のドキュメントも参照してください。

GPU ワーカーグループの設定
GPU リソースの要求
GPU の確認
注意事項