IT運用管理現場における「予兆検知」とは

アプリケーションパフォーマンス管理

技術の複雑化で監視はより難しい時代に

昨今のITサービスの現場では、クラウドやコンテナ仮想化、サーバーレスアーキテクチャなどの技術が注目されています。それに伴い、ネットワークインフラにも様々な技術が導入され複雑化しています。オンプレミスサーバーやハイパーバイザー型仮想化などで構成された従来型の環境と異なり、多種類のアーキテクチャが含まれて複雑化したネットワークインフラは管理・監視の難易度が高まります。

一方でITサービスは、ユーザーのニーズや利用場面が多様化して止めることができなくなり、常に安定稼働を求められるようになっています。止めることができないシステムは、問題が発生していないか24時間365日の監視が必要で、現場のシステム管理者への負担が増しています。
インフラ面・ユーザー面の両面からシステム管理者への負荷が高まっている今日において、システムを適切に管理・監視するには、人手に頼ったマンパワーの監視をやめて効率化することが大切です。

システム障害の予兆検知機能を搭載した
アプリケーション性能管理ツール Applications Manager

大きなトラブルになる前に小さく対処するための手法とは

従来のシステム監視における障害発見の手法としてよく用いられる基準に「しきい値」があります。しかしこのしきい値を用いて効率の良い監視環境を実現するのは、簡単そうに見えて難易度が高いと言えます。

しきい値が低すぎる場合はしきい値を超える値が発生しやすく、アラートが多発する可能性があります。この場合、本当に影響が大きい障害に繋がるアラートと重要でないアラートが混在し、システム管理者を混乱させることになります。 逆にしきい値を高く設定した場合、システムのわずかな変化を発見できずに見逃してしまう可能性があります。アラートが発報された時点では既に大規模障害に発展したあとだった……という状況を作り出しかねません。

障害を効率良く防ぐためには、従来のしきい値での監視に加え、システムのわずかな変化を見逃さないようにする監視の仕組みが必要です。 効率の良い監視環境の実現のための手法として注目されているのが「予兆監視」です。

予兆検知とは?システム運用管理の現場で予兆検知するメリット

IT運用管理における予兆検知とは、過去のシステムパフォーマンスのデータを参照して、障害に繋がる動作状況を障害発生前に知ることと、その仕組みを指します。

IT運用管理の現場で予兆検知ができるようになると、システム管理者は、障害が発生する前に異常状態を把握できるようになります。障害の影響が広範囲に及ぶ前に対処でき、原因切り分けに手間取って障害復旧が遅くなることが少なくなり、ユーザーに影響が及びにくくなります。
システムのユーザーへのメリット以外にも、システム管理者の負担を軽くすることにも繋がります。

監視における予兆検知の例

ここからは、ネットワークインフラ・システムの監視における予兆検知の例をご紹介します。

可変しきい値

従来のしきい値を、より実態に合った値に設定するための仕組みです。 従来のしきい値は人があらかじめしきい値を決めて設定を行います。しかし適切なしきい値は監視する環境によって異なるため、そのシステムの示すパフォーマンスの傾向に適したしきい値を設定することが難しいのです。
可変しきい値とは、監視システムに蓄積された過去の監視データを用いて、ツールが自動に適切な値を算出して設定されるしきい値のことです。例えば「過去一週間のパフォーマンスデータの平均値+10%」をしきい値に設定すると、そのシステムの利用実績に合わせたしきい値が毎週新たに設定されることになります。

可変しきい値を用いると、しきい値によるアラートの頻発や見逃しを減らし、より早い段階でシステム障害を発見することができます。

アノマリ検知

アノマリ検知は、平常時のパフォーマンス値の範囲から外れた挙動を示した場合を「異常」として扱います。
ある値を超えたら障害と判断するしきい値と異なり、アノマリ検知はパフォーマンスデータから監視データが取るべき正常な値の「範囲」を判断します。

例えば「過去一週間のパフォーマンスのデータの上下5%」を正常な範囲と設定すると、しきい値と同様にパフォーマンスの高まりを早い段階で検知できるほか、長期間にわたって徐々に増加するパフォーマンス値など、しきい値では気づきにくいパフォーマンス値の小さな変化についても見逃さず早い段階で把握可能です。

データ予測

データ予測とは、過去の監視データの傾向から、将来のパフォーマンス値を予測することです。
例えばサーバーやストレージのディスク容量などにおいて、過去の利用実績と変化の傾向のデータがあれば、将来的にいつ頃ディスクの空き容量がなくなるのかを予測できます。

データ予測が可能になれば、システム管理者は問題が発生する前に事前に対処することで、障害の発生を完全に予防することが可能です。

簡単にシステムの予兆検知が導入できる監視ツール

ManageEngineのアプリケーションパフォーマンス管理ソフトウェア(APMツール)である「Applications Manager」も、ネットワークやサーバー、Webシステムの予兆検知が簡単に導入できるツールの一つです。

管理対象のシステムやアプリケーションをすべてApplications Managerに集約することで、Applications Managerひとつで監視と障害管理のほか、予兆検知やデータ解析を統合することが可能です。

監視環境の効率化をご検討の際には、是非Applications Managerをお試しください。

無料で使えます[機能・監視数 無制限]

ダウンロードはこちら 概要資料はこちら

機械学習機能を用いた予測レポート

機械学習技術を用いた予測レポート

今すぐ活用できる統計分析レポート

今すぐ活用できる統計分析レポート

関連機能

無料で使えます[機能・監視数 無制限]

ダウンロードはこちら 概要資料はこちら