メインコンテンツまでスキップ

モデルメトリクス

注意: モデルメトリクスは、実行パイプラインが Running 状態かつ Training ステージにある場合にのみ有効になります。

Alt text

モデルメトリクス は、ファインチューニングプロセス中およびプロセス後に AI モデルのトレーニングパフォーマンスを追跡するために収集されます。これらのメトリクスはトレーニングの異常を検出し、ハイパーパラメータの調整を誘導し、モデルのパフォーマンスを改善するのに役立ちます。 トレーニングメトリクス:

メトリクス評価内容
lossモデルの学習状況を測定します。損失が高いと予測が悪いことを意味し、損失が低いとモデルがデータによく適合していることを意味します。
learning_rateモデルの学習速度を制御します。学習率が高すぎると不安定になる可能性があり、低すぎるとトレーニングが遅くなります。
grad_norms勾配の大きさを示します。勾配消失や勾配爆発などの問題を検出するのに役立ち、学習に影響します。
epochモデルがトレーニングデータを何回通過したかを追跡します。時間の経過とともに学習の進捗をモニタリングするのに有用です。
評価メトリクス:
注意: 評価データを使用する場合のみ表示されます。
メトリクス評価内容
------
eval_runtime評価プロセスにかかる時間を測定します。パフォーマンスベンチマークに有用です。
eval_samples_per_second評価スループットを示します。値が高いほどモデル検証が速くなります。
eval_steps_per_second1 秒あたりに完了する評価ステップ数を測定します。評価効率を反映します。
eval_lossモデルが未見データに対してどれだけ汎化できるかを測定します。過学習または未学習を検出するのに役立ちます。
トレーニングパフォーマンスメトリクス:
メトリクス評価内容
------
train_runtimeトレーニングに費やした合計時間です。トレーニングコストと効率を推定するのに有用です。
train_samples_per_secondトレーニングスループットを測定します。値が高いほどトレーニングが速いことを示します。
train_steps_per_second1 秒あたりに完了するトレーニングステップ数を示します。トレーニング速度を反映します。
total_flos使用された浮動小数点演算の総数です。計算コストとモデルの複雑さを推定するのに役立ちます。
train_lossモデルがトレーニングデータにどれだけ適合しているかを測定します。トレーニングが効果的であれば時間とともに減少するはずです。