FAQ
1. モデルのファインチューニングとは何ですか?
モデルのファインチューニングとは、ベース言語モデルを専門的なデータセットで再トレーニングし、特定の分野や対象ユースケースにおいてモデルがより良いパフォーマンスを発揮できるようにするプロセスです。
2. ファインチューニングにはどのモデルを選ぶべきですか?
- 小規模モデル(1B パラメータ以下)→ テストや軽量なワークロード向け
- 中規模モデル(7B〜13B)→ パフォーマンスとコストのバランスが取れています
- 大規模モデル(30B 以上)→ 複雑なタスク向けで、通常はマルチノード構成が必要です
- タスクがプロンプト・レスポンス形式に基づく場合は、instruction-tuned モデルが推奨されます
3. ファインチューニングにはどのくらい時間がかかりますか?
所要時間は以下に依存します:
- モデルサイズ(小規模モデルで数時間、非常に大規模なモデルで数日)
- データセットサイズ
- ハードウェア構成(ハイパーパラメータとインフラ)
通常、数時間から数日の範囲です。
4. モデルをファインチューニングする前に何を準備する必要がありますか?
次のものが必要です:
- クリーンで多様、かつ重複のないデータ。
- ファインチューニングの明確な目的(例: 技術サポート、カスタマーサービス、コンテンツ作成など)。
5. モデルのファインチューニングには何台の GPU が必要ですか?
必要な数はモデルサイズによって異なります:
- 1B パラメータ未満: 1 GPU(24 GB VRAM)で十分
- 7B モデル: 2〜4 GPU(各 40 GB VRAM)
- 13B モデル: 4〜8 GPU を推奨
- 30B 以上のモデル: 8 台以上の GPU とマルチノード構成が必要
6. 複数ノードが必要ですか、それとも 1 ノードだけで十分ですか?
- 小〜中規模モデル(最大 13B)の場合、複数 GPU を搭載した 1 ノードで十分です。
- より大規模なモデル(30B 以上)の場合、メモリとパフォーマンスを向上させるためにマルチノード構成が推奨されます。
7. 最低限必要な GPU メモリはどのくらいですか?
- 標準のファインチューニングでは GPU あたり少なくとも 24GB の VRAM が必要です
- LoRA/QLoRA 手法 を使用すれば、8〜16GB VRAM の GPU でもファインチューニングが可能です
8. トレーニングデータセットのサイズはハードウェア要件に影響しますか?
はい。データセットが大きいほど、より多くの VRAM、RAM、ストレージ容量が必要になります。
- データセット 20GB 未満 → Managed volume を使用できます
- データセット 20GB 超 → Dedicated network volume が必要です