AWS Step Function監視

概要

AWS Step Functionsは、複数のAWSサービスを連携させることでサーバーレスワークフローを構築・実行できるマネージドサービスです。視覚的なワークフロー設計と監視により、ビジネスプロセスの確実な実行を実現します。
Applications Managerは、実行結果(失敗、タイムアウト、スロットル、中止、成功)、実行率、実行時間を追跡し、ワークフローの正常性を確保します。Expressステートマシンの場合、課金時間と課金メモリも監視し、コスト最適化を支援します。

新しいAWS Step Function監視の作成方法

新しいAWS Step Function監視を作成する方法については、こちらをご参照ください。

監視対象パラメーター

[監視]タブをクリックして、監視カテゴリビューに移動します。「クラウドアプリ」セクションの「Amazon」配下にある「Step Function」インスタンスをクリックします。AWS Step Functionの一括設定ビューが以下のタブに分かれて表示されます。

  • 可用性]タブには、過去24時間または30日間の可用性履歴が表示されます。
  • パフォーマンス]タブには、過去24時間または30日間の応答時間と正常性の履歴が表示されます。
  • リストビュー]を使用すると、一括設定を実行できます。

リストから監視をクリックすると、次のタブを含むAWS Step Functionダッシュボードに移動します。

パフォーマンス概要

パラメーター 説明
STATE MACHINE INFORMATION
Type ステートマシンのタイプ
Status ステートマシンの現在のステータス
Versions ポーリング時にステートマシンに対して公開されるバージョンの最大数
Aliases ポーリング時にステート マシンに作成されるバージョンの最大数
STATE MACHINE EXECUTION PERFORMANCE(単位:%)
Failed Execution Percentage ポーリング時に失敗した実行の割合(単位:%)
Timed Out Execution Percentage ポーリング間隔の間にタイムアウトした実行の割合(単位:%)
Aborted Execution Percentage ポーリング間隔の間に中止された実行の割合(単位:%)
Throttled Execution Percentage ポーリング間隔の間に調整された実行の割合(単位:%)
Succeeded Execution Percentage ポーリング間隔の間に成功した実行の割合(単位:%)
Total Execution Failure Percentage ポーリング間隔の間に失敗した実行 (失敗、タイムアウト、中止、調整) の合計割合(単位:%)
EXECUTION ERRORS
Failed Executions ポーリング間隔の間に失敗した実行の合計数(単位:カウント)
Timed Out Executions ポーリング間隔の間にタイムアウトした実行の合計数(単位:カウント)
Aborted Executions ポーリング間隔の間に中止された実行の合計数(単位:カウント)
Throttled Executions ポーリング間隔の間に調整(Throttled)された実行の合計数(単位:カウント)
TOTAL EXECUTION
Total Executions Rate ポーリング間隔内の1分あたりのステートマシン実行(失敗、タイムアウト、中止、スロットル、成功)の合計数(単位:カウント/分)
この数には、再実行も含まれます。
Total Executions ポーリング間隔内のステートマシン実行(失敗、タイムアウト、中止、スロットル、成功)の総数(単位:カウント)
この数には再実行も含まれます。
SUCCEEDED EXECUTIONS
Succeeded Executions Rate ポーリング間隔の間の1分あたりの正常に完了した実行の合計数(単位:カウント/分)
Succeeded Executions ポーリング間隔の間に正常に完了した実行の合計数(単位:カウント)
STARTED EXECUTIONS
Started Executions Rate ポーリング間隔の間の1分あたりの開始された実行の合計数(単位:カウント/分)
Started Executions ポーリング間隔の間に開始された実行の合計数(単位:カウント)
EXECUTION DURATION
Average Execution Duration ポーリング間隔の間に実行されたすべての実行について計算された、実行の開始時刻と終了時刻の間にかかった平均時間(単位:秒)

Redrivenの実行

このタブは標準ステートマシンにのみ適用されます。
パラメーター 説明
REDRIVEN EXECUTION PERFORMANCE(単位:%)
Failed Redriven Execution Percentage ポーリング間隔の間に失敗した再実行の割合(単位:%)
Timed Out Redriven Execution Percentage ポーリング間隔の間にタイムアウトした再実行の割合(単位:%)
Aborted Redriven Execution Percentage ポーリング間隔の間に中止された再実行の割合(単位:%)
Succeeded Redriven Execution Percentage ポーリング間隔の間に成功した再実行の割合(単位:%)
Total Redriven Failure Percentage ポーリング間隔の間に失敗した再実行の合計割合(失敗、タイムアウト、中止を含む)(単位:%)
REDRIVEN EXECUTION ERRORS
Failed Redriven Executions ポーリング間隔の間に失敗した再実行の合計数(単位:カウント)
Timed Out Redriven Executions ポーリング間隔の間にタイムアウトした再実行の合計数(単位:カウント)
Aborted Redriven Executions ポーリング間隔の間に中止された再実行の合計数(単位:カウント)
REDRIVEN EXECUTIONS
Redriven Executions ポーリング間隔の間に再実行された(失敗後に再試行された)実行の合計数(単位:カウント)
Redriven Execution Percentage ポーリング間隔の間に失敗した実行、タイムアウトした実行、中止した実行から再試行された再実行の割合(単位:%)
SUCCEEDED REDRIVEN EXECUTIONS
Succeeded Redriven Executions ポーリング間隔の間に成功した再実行の合計数(単位:カウント)

失敗した実行

  • このタブは標準ステートマシンにのみ適用されます。
  • この表には、最近1000件の失敗した実行の詳細(存在する場合)が表示されます。
パラメーター 説明
Failed Execution Details
Execution Name 実行の名前
Start Time 実行が開始された日付
End Time 実行が終了した日付
Duration 失敗した実行の合計時間(単位:秒)
Number of Redrives 失敗した実行ごとの再実行(再試行)の合計数

Expressマシン

このタブはExpressのステートマシンにのみ適用されます。
パラメーター 説明
Express Billed Memory Rate ポーリング間隔間のExpressワークフローの1分あたりの合計課金メモリ(単位:MB/分)
Express Actual Memory Rate ポーリング間隔の間にExpress Workflowsによって1分あたりに消費されるメモリの合計(単位:MB/分)
Express Billed Memory ポーリング間隔間のExpressワークフローの合計課金メモリ(単位:MB)
Express Billed Duration ポーリング間隔間のExpress Workflows実行の課金期間(単位:分)

構成

パラメーター 説明
CONFIGURATION
作成時間 ステートマシンが作成された日時
Role ARN ステートマシンの作成時に使用されるIAMロールのAmazonリソース名(ARN)
KMS Key ID データの暗号化に使用されるKMSキー(エイリアス、ID、ARN)
Revision ID ステートマシンのリビジョン識別子
ラベル マップ文字列を識別する、ユーザーによって識別される文字列または自動識別される文字列。
※入力で指定されたstateMachineArnが修飾されたステートマシンARNである場合にのみ存在します。
X-Rayトレーシング X-Rayトレーシングが有効かどうかを示します。