メインコンテンツまでスキップ

Logs And Monitoring

GPU Containerはワークロードの監視とトラブルシューティングに役立つコンテナログメトリクスを提供します。ログとメトリクスを表示するには、コンテナ詳細画面を開き、「ログ」または「モニタリング」タブを開きます。これにより、コンテナのログとメトリクス監視が提供され、問題の診断やコンテナのアクティビティの監視が容易になります。

コンテナログ

コンテナログにはすべてのアプリケーションログが含まれます。ログは14日間のみ保持され、タイムスタンプはUTCタイムゾーンで表示されることにご注意ください。 Alt text

  1. ダウンロード:コンテナの過去14日間のログをダウンロードします。
  2. 検索:ログ内容でキーワードを検索します。
  3. 時間フィルター:特定の時間範囲でログをフィルタリングします。
  4. 更新:コンテナログが自動的に更新される間隔です。

メトリクス監視

監視メトリクスは、コンテナ化されたサービスのパフォーマンス、可用性、リソース使用状況を追跡するために収集され、問題の検出と運用の最適化に役立ちます。メトリクスデータは14日間保持されます。 4つのメトリクスグループがあります:

  • 使用率メトリクス:システムのパフォーマンスとリソース効率を評価するために、CPU、メモリ、GPU使用率を監視します。
  • ディスクメトリクス:ストレージの問題やボトルネックを検出するために、ディスクの読み取り/書き込み速度とレイテンシを追跡します。
  • ネットワークメトリクス:接続の問題を特定してサービスの信頼性を確保するために、ネットワークトラフィック、レイテンシ、エラーを測定します。
  • 温度と電力メトリクス:過熱を防ぎハードウェアの健全性を維持するために、ハードウェアの温度と消費電力を監視します。 Alt text
  1. 時間フィルター:特定の時間範囲でメトリクスをフィルタリングします。
  2. 更新:コンテナメトリクスが自動的に更新される間隔です。