GPU Sharing
GPU Sharing は、1 つの物理 GPU を複数の Pod やコンテナで共有する機能です。FPT Cloud の Managed Kubernetes Engine(M-FKE)では、GPU リソースを効率的に活用するための GPU Sharing メカニズムを提供しています。
GPU Sharing の概要
通常の Kubernetes では、GPU は整数単位で割り当てられます。GPU Sharing を使用することで、1 つの GPU を複数のワークロードで共有し、GPU リソースの使用効率を向上させることができます。
以下のユースケースで GPU Sharing が有効です。
- 推論(inference)ワークロードのように、1 つの GPU 全体を必要としない場合
- 開発・テスト環境で複数のユーザーが GPU を共有する場合
- コスト最適化のために GPU 利用率を最大化したい場合
GPU Sharing の設定
GPU Sharing を利用するには、適切な device plugin と設定が必要です。FPT Cloud が管理する M-FKE クラスターでは、GPU Sharing のサポートが組み込まれています。
GPU のフラクショナルな割り当て例:
apiVersion: v1
kind: Pod
metadata:
name: gpu-sharing-pod
spec:
containers:
- name: gpu-container
image: nvidia/cuda:11.0-base
resources:
limits:
nvidia.com/gpu: "0.5"
注意事項
- GPU Sharing を使用する場合、各 Pod が使用するメモリ量を適切に設定してください。
- GPU Sharing と通常の GPU 割り当てを混在させる場合は注意が必要です。
- GPU Sharing の詳細設定については、FPT Cloud サポートにお問い合わせください。
詳細については、Kubernetes 上の GPU サービス のドキュメントも参照してください。