モデルメトリクス
注意: モデルメトリクスは、実行パイプラインが Running 状態かつ Training ステージにある場合にのみ有効になります。
モデルメトリクス は、ファインチューニングプロセス中およびプロセス後に AI モデルのトレーニングパフォーマンスを追跡するために収集されます。これらのメトリクスはトレーニングの異常を検出し、ハイパーパラメータの調整を誘導し、モデルのパフォーマンスを改善するのに役立ちます。 トレーニングメトリクス:
| メトリクス | 評価内容 |
|---|---|
| loss | モデルの学習状況を測定します。損失が高いと予測が悪いことを意味し、損失が低いとモデルがデータによく適合していることを意味します。 |
| learning_rate | モデルの学習速度を制御します。学習率が高すぎると不安定になる可能性があり、低すぎるとトレーニングが遅くなります。 |
| grad_norms | 勾配の大きさを示します。勾配消失や勾配爆発などの問題を検出するのに役立ち、学習に影響します。 |
| epoch | モデルがトレーニングデータを何回通過したかを追跡します。時間の経過とともに学習の進捗をモニタリングするのに有用です。 |
| 評価メトリクス: | |
| 注意: 評価データを使用する場合のみ表示されます。 | |
| メトリクス | 評価内容 |
| --- | --- |
| eval_runtime | 評価プロセスにかかる時間を測定します。パフォーマンスベンチマークに有用です。 |
| eval_samples_per_second | 評価スループットを示します。値が高いほどモデル検証が速くなります。 |
| eval_steps_per_second | 1 秒あたりに完了する評価ステップ数を測定します。評価効率を反映します。 |
| eval_loss | モデルが未見データに対してどれだけ汎化できるかを測定します。過学習または未学習を検出するのに役立ちます。 |
| トレーニングパフォーマンスメトリクス: | |
| メトリクス | 評価内容 |
| --- | --- |
| train_runtime | トレーニングに費やした合計時間です。トレーニングコストと効率を推定するのに有用です。 |
| train_samples_per_second | トレーニングスループットを測定します。値が高いほどトレーニングが速いことを示します。 |
| train_steps_per_second | 1 秒あたりに完了するトレーニングステップ数を示します。トレーニング速度を反映します。 |
| total_flos | 使用された浮動小数点演算の総数です。計算コストとモデルの複雑さを推定するのに役立ちます。 |
| train_loss | モデルがトレーニングデータにどれだけ適合しているかを測定します。トレーニングが効果的であれば時間とともに減少するはずです。 |
