メインコンテンツまでスキップ

金融タスク向けに Gemma 3 27B Instruct モデルをファインチューニングする

はじめに

Gemma-3-27B-Instruct は、マルチモーダル機能 (text+image)、128K トークンのコンテキストウィンドウ (長い金融ドキュメントに最適)、強力な推論能力、多言語サポートを備えた高性能な instruction-tuned モデルです。 金融データセットでファインチューニングすることで、次のことが可能になります:

  • ドメイン固有の用語を理解します
  • 複雑な金融の質問に回答します
  • 非構造化レポートから構造化データを抽出します
  • 金融ドキュメントからサマリーやインサイトを生成します

ステップバイステップ: SFT によるファインチューニング

1. 金融データセットを準備します

推奨ソース:

2. Model Fine-tuning Portal にアクセスし、Create New Pipeline をクリックします

詳細:

  • Model source: Model Catalog
  • Model name: google/gemma-3-27b-it
  • Trainer: SFT
  • Volume: Managed volume
  • Data format: Alpaca
  • Training data: 'Cleaned_data.json' をアップロード
  • Evaluation data: None
  • Hyperparameters:
    • Batch size: 1
    • Epochs: 3
    • Gradient accumulation steps: 4
    • Checkpoint steps: 500
    • Logging steps: 10
    • ...
  • Infrastructure:
    • Node: 1
    • Flavor: 8 x GPU NIVIDIA H100 SXM5 (128CPU - 1536GB RAM - 8xH100)
  • Pipeline name: ft.pipeline_0251509140923

3. パイプラインを開始します

パイプラインの初期化を待ちます。このプロセスは通常、完了までに約 15 分かかります。

4. モニタリング

進捗状況は Model metrics、System metrics、Logs で監視できます。