Applications Manager ナレッジベース

セルフ監視のポーリングについて


概要

セルフ監視での以下のポーリング結果判断基準の違いについてご紹介します。
  • 成功したポーリング
  • ポーリング遅延
  • データ収集の失敗
  • まとめ

セルフ監視に関しましてはこちらのユーザーガイドをご参照ください。

前提条件:それぞれ、ポーリング間隔は5分に設定されているとします。
成功したポーリング
監視対象に対して、13:00:01にポーリングした場合、データは5分以内に返される必要があります。(=13:00〜13:05の間)
5分以内に返された場合、ポーリングは成功と見なされます。また、13:00にポーリングした結果が13:03に返ってきた場合、13:03+5分の13:08に次回のポーリングが実行されます。
ポーリング遅延
監視対象に対して、13:00:01にポーリングした場合、データは5分以内に返される必要があります。(=13:00〜13:05の間)
5分以内に返された場合、ポーリングは成功と見なされます。

13:05まで応答がない場合は、次回のポーリングを13:05:01に実行します。

13:06や13:07など5分以上経ってから13:00に送られたポーリングのデータを取得した場合、
ポーリング遅延と見なされます。

その後、上記のデータ収集が遅れたため、次回のポーリングはデータ収集された時間の5分後に実行されます。
(例えば13:07に結果が返ったら、次回のポーリングのタイミングは13:12:01です。)

※データ遅延の際、13:05にポーリングを実行しますが、ポーリングごとにユニークなIDが割り当てられているため、
13:07に収集されたデータは13:05のポーリングではなく13:00のポーリング結果だと判断されます。
※13:05に実行したポーリングの結果が返ってきたとしても、1回目のポーリング結果が返った時点で13:05のポーリングの結果は無視されます。
ポーリング遅延は1回の遅延ではアラートは発生しません。参照:ユーザーガイド
ポーリング遅延が頻発する場合には、ポーリング間隔の見直しを行うことをお勧めいたします。
データ収集の失敗
監視対象に対して、13:00にポーリングした場合、データは5分以内に返される必要があります(つまり、13:00〜13:05の間)。
5分以内に返された場合、ポーリングは成功と見なされます。13:05まで応答がない場合は、次回のポーリングを実行します。
13:00→13:05→13:10と3回の連続したポーリングを実行しても監視対象からデータが13:15まで収集されなかった場合、
監視対象からの応答がないと見なされ、データ収集の失敗となります。
遅延の原因やデータ収集失敗の原因は、以下のような環境上の理由である可能性がございます。
・監視対象にアクセスできない。
・Applications Managerと監視対象間の接続に問題があった。
・監視対象がダウンした。

まとめ

Applications Managerでは、ポーリングに返答があった時間からポーリング間隔時間(5分)後に、次回のポーリングを実行します。

例①(成功したポーリング)

13:00にポーリング

13:03に返答

13:03+5分後の13:08に2回目のポーリングが実行されます。

例②(ポーリング遅延)

13:00に①ポーリング

13:05に返答がない

13:05:01に②ポーリング

13:07に①に対して返答が来る

13:07+5分後=13:12:01に2回目のポーリングが実行されます。

※①への返答が来た時点で、②ポーリングの返答が13:09等に来たとしても、ポーリングの重複を避けるため②ポーリングは無視され、次回のポーリングは13:12:01→13:17:01と続きます。