メインコンテンツまでスキップ

LoRA 推論のデプロイ

ファインチューニング済みの LoRA モデルをデプロイするには？

インフラを管理することなく、ファインチューニング済みの LoRA モデルを API 経由で即座に使用できるようにデプロイできます。

手順

ナビゲーションバーから 「Deployment」ページ に移動します。
- または、ファインチューニング完了後の成功ポップアップから 「View deployment」 をクリックします。

デプロイしたい LoRA モデルの横にある 「Deploy」 をクリックします。
- ステータスが Deploying に変わります。
デプロイが成功すると、ステータスが Deployed と表示されます。

デプロイ済みモデルを管理するには？

「Deployment」 ページでは以下の操作が可能です。

Get API Key — モデルを呼び出すためのキーを取得します。
View API request — サンプル JSON レスポンスのポップアップを開きます。
Try in Playground — UI でモデルを直接テストします。
Undeploy — デプロイ済みモデルを停止します（確認が必要）。

ステータスバッジ

Deploying — モデルをデプロイ中です。
Deployed — モデルが推論に使用可能な状態です。
Stopped — モデルがアンデプロイされています。
Failed — デプロイに失敗しました。

ファインチューニング済みの LoRA モデルをデプロイするには？
- 手順
デプロイ済みモデルを管理するには？
- ステータスバッジ