メインコンテンツまでスキップ

FAQ

1. モデルのファインチューニングとは何ですか?

モデルのファインチューニングとは、ベース言語モデルを専門的なデータセットで再トレーニングし、特定の分野や対象ユースケースにおいてモデルがより良いパフォーマンスを発揮できるようにするプロセスです。

2. ファインチューニングにはどのモデルを選ぶべきですか?

小規模モデル(1B パラメータ以下)→ テストや軽量なワークロード向け
中規模モデル(7B〜13B)→ パフォーマンスとコストのバランスが取れています
大規模モデル(30B 以上)→ 複雑なタスク向けで、通常はマルチノード構成が必要です
タスクがプロンプト・レスポンス形式に基づく場合は、instruction-tuned モデルが推奨されます

3. ファインチューニングにはどのくらい時間がかかりますか?

所要時間は以下に依存します:

モデルサイズ(小規模モデルで数時間、非常に大規模なモデルで数日)
データセットサイズ
ハードウェア構成(ハイパーパラメータとインフラ)

通常、数時間から数日の範囲です。

4. モデルをファインチューニングする前に何を準備する必要がありますか?

次のものが必要です:

クリーンで多様、かつ重複のないデータ。
ファインチューニングの明確な目的(例: 技術サポート、カスタマーサービス、コンテンツ作成など)。

5. モデルのファインチューニングには何台の GPU が必要ですか?

必要な数はモデルサイズによって異なります:

1B パラメータ未満: 1 GPU(24 GB VRAM)で十分
7B モデル: 2〜4 GPU(各 40 GB VRAM)
13B モデル: 4〜8 GPU を推奨
30B 以上のモデル: 8 台以上の GPU とマルチノード構成が必要

6. 複数ノードが必要ですか、それとも 1 ノードだけで十分ですか?

小〜中規模モデル(最大 13B)の場合、複数 GPU を搭載した 1 ノードで十分です。
より大規模なモデル(30B 以上)の場合、メモリとパフォーマンスを向上させるためにマルチノード構成が推奨されます。

7. 最低限必要な GPU メモリはどのくらいですか?

標準のファインチューニングでは GPU あたり少なくとも 24GB の VRAM が必要です
LoRA/QLoRA 手法 を使用すれば、8〜16GB VRAM の GPU でもファインチューニングが可能です

8. トレーニングデータセットのサイズはハードウェア要件に影響しますか?

はい。データセットが大きいほど、より多くの VRAM、RAM、ストレージ容量が必要になります。

データセット 20GB 未満 → Managed volume を使用できます
データセット 20GB 超 → Dedicated network volume が必要です

1. モデルのファインチューニングとは何ですか?
2. ファインチューニングにはどのモデルを選ぶべきですか?
3. ファインチューニングにはどのくらい時間がかかりますか?
4. モデルをファインチューニングする前に何を準備する必要がありますか?
5. モデルのファインチューニングには何台の GPU が必要ですか?
6. 複数ノードが必要ですか、それとも 1 ノードだけで十分ですか?
7. 最低限必要な GPU メモリはどのくらいですか?
8. トレーニングデータセットのサイズはハードウェア要件に影響しますか?