📄️ サンプルGPUワークロードを試す
Managed GPU Cluster上にサンプルGPUワークロードをデプロイする方法。
📄️ シングルGPUの例:vLLMを使ったLLMの推論サービング
このガイドでは、vLLMフレームワークを使用してFPT Kubernetes Engine(FKE GPU)のシングルGPUでGemma 3大規模言語モデル(LLM)をデプロイしてサービングする方法を説明します。
📄️ マルチGPUの例:vLLMを使ったLLMの推論サービング
このガイドでは、vLLMフレームワークを使用してFPT Kubernetes Engine(FKE GPU)の複数のGPUでGemma 3大規模言語モデル(LLM)をデプロイしてサービングする方法を説明します。
📄️ マルチノードの例:vLLMとマルチホストサービング
このガイドでは、vLLMフレームワークを使用してFPT Kubernetes Engine(FKE GPU)の複数のノードでGemma 3大規模言語モデル(LLM)をデプロイしてサービングする方法を説明します。
📄️ KubernetesでUnslothを使ってLLMモデルをファインチューニングする
このガイドでは、UnslothとGPUを使用してKubernetes上でLLMモデルをファインチューニングする方法を説明します。