モデルメトリクス

注意: モデルメトリクスは、実行パイプラインが Running 状態かつ Training ステージにある場合にのみ有効になります。

モデルメトリクス は、ファインチューニングプロセス中およびプロセス後に AI モデルのトレーニングパフォーマンスを追跡するために収集されます。これらのメトリクスはトレーニングの異常を検出し、ハイパーパラメータの調整を誘導し、モデルのパフォーマンスを改善するのに役立ちます。トレーニングメトリクス:

メトリクス	評価内容
loss	モデルの学習状況を測定します。損失が高いと予測が悪いことを意味し、損失が低いとモデルがデータによく適合していることを意味します。
learning_rate	モデルの学習速度を制御します。学習率が高すぎると不安定になる可能性があり、低すぎるとトレーニングが遅くなります。
grad_norms	勾配の大きさを示します。勾配消失や勾配爆発などの問題を検出するのに役立ち、学習に影響します。
epoch	モデルがトレーニングデータを何回通過したかを追跡します。時間の経過とともに学習の進捗をモニタリングするのに有用です。
評価メトリクス:
注意: 評価データを使用する場合のみ表示されます。
メトリクス	評価内容
---	---
eval_runtime	評価プロセスにかかる時間を測定します。パフォーマンスベンチマークに有用です。
eval_samples_per_second	評価スループットを示します。値が高いほどモデル検証が速くなります。
eval_steps_per_second	1 秒あたりに完了する評価ステップ数を測定します。評価効率を反映します。
eval_loss	モデルが未見データに対してどれだけ汎化できるかを測定します。過学習または未学習を検出するのに役立ちます。
トレーニングパフォーマンスメトリクス:
メトリクス	評価内容
---	---
train_runtime	トレーニングに費やした合計時間です。トレーニングコストと効率を推定するのに有用です。
train_samples_per_second	トレーニングスループットを測定します。値が高いほどトレーニングが速いことを示します。
train_steps_per_second	1 秒あたりに完了するトレーニングステップ数を示します。トレーニング速度を反映します。
total_flos	使用された浮動小数点演算の総数です。計算コストとモデルの複雑さを推定するのに役立ちます。
train_loss	モデルがトレーニングデータにどれだけ適合しているかを測定します。トレーニングが効果的であれば時間とともに減少するはずです。