メインコンテンツまでスキップ

サンプルGPUワークロードを試す

このセクションでは、FPT Managed GPU Cluster上にサンプルGPUワークロードをデプロイする方法を紹介します。

以下のガイドを参考に、実際のワークロードをデプロイしてみてください：

シングルGPUの例：vLLMを使ったLLMの推論サービング — 1つのGPUを使用してLLMを推論サービングする基本的な例。
マルチGPUの例：vLLMを使ったLLMの推論サービング — 複数のGPUを使用してLLMをサービングする例。
マルチノードの例：vLLMとマルチホストサービング — 複数のノードにまたがってLLMをサービングする例。
KubernetesでUnslothを使ってLLMモデルをファインチューニングする — UnslothでLLMモデルをファインチューニングする例。

これらのガイドには、必要なマニフェスト、設定手順、および動作確認方法が含まれています。