障害管理

サーバー・ネットワーク統合監視

障害管理

障害発生をメールやトラップで受信

技術者派遣の前に「問題が何か」を知ること

担当者が少ない環境では、サーバーやネットワークの障害管理とその修復作業は大変負荷のかかる作業です。 遠隔地のサーバーやネットワークを管理している場合は、さらに事態は深刻です。実際はリモートから修復できるような問題に対しても調査を行うために技術者を派遣して、現場に到着後、適切な準備ができていなかったために戻らなくてはならなかったというように、障害復旧には多くの時間が割かれてしまいます。多くの場合、障害の復旧より発生した原因の特定により時間がかかります。 OpManagerをはじめとするサーバー・ネットワーク監視ツールの障害管理機能を使用することで、障害が発生した原因を迅速に特定し、エンドユーザーの業務に影響が及ぶ前に復旧できます。

OpManagerの障害管理と障害通知機能

OpManagerは、アラート発生時に、メールを使用して担当者に通知したり、外部プログラムや設定したシステムコマンドを実行する、障害通知機能を備えています。

アラートの色分け、履歴の参照

OpManagerは、優れたアラート処理機能を提供します。ネットワーク上で発生した全てのアラートから、不要なアラートをフィルリングして、重要なアラートだけを管理者に通知します。ユーザーインタフェース上でも、管理者が一目でステータスを把握できるように、重要度に応じて各アラート色分け表示します。また、管理者はアラートに関係する履歴の表示、手動によるアラートのクリア、削除ができます。

アラートビュー

アラートビュー

アイコンステータス意味
Critical重大(Critical)デバイスへのポーリングに連続5回未応答
Trouble警告(Trouble)デバイスへのポーリングに連続3回未応答
Attention注意(Attention)デバイスへのポーリングに1回未応答
Service Downサービスダウン (Service Down)サービスやインターフェスなどがダウンしている状態
Clearクリア(Clear)デバイスへのポーリングに応答有り(通常状態)
Unmanaged非管理、メンテナンス中メンテナンス中など、監視をしていない状態

OpManagerの死活監視におけるアラート通知と重要度を示す表示マーク

重大な障害を見逃さない、繰り返し通知機能

管理者がアラートを確認するまで、障害発生から指定した間隔で繰り返し管理者に通知します。繰り返し通知の他、障害発生から指定した時間が経過してから通知をするオプションも選択できます。 重要なアラートを見逃すことなく、確実にサーバー障害やネットワーク障害に対処する支援をします。

アラートの条件設定

アラートの条件設定

SNMPトラップと企業MIBのサポート

今日ネットワーク機器では、障害発生時にSNMPトラップを送信する機能が実装されています。優れた障害監視システムはSNMPトラップをサポートし、重要な情報を管理者に通知します。 OpManagerではSNMPトラップを標準でサポートしています。さらに企業MIBのトラップを追加することができます。OpManagerでは、受信したSNMPトラップに含まれるVarbindのマッチングもフィルタとして設定できます。異なるベンダーの装置を所有している場合でも、ベンダー特有のMIB情報を入手することにより、装置の重要なイベントを監視できます。

MIB ブラウザー

MIB ブラウザー

Syslog送信/SNMPトラップ送信

「SNMPトラッププロセッサー」の詳細を見る

ネットワーク機器には、障害発生時にSNMPトラップを送信する機能が実装されています。企業MIBのトラップを追加することができます。SNMPトラップ送信は、SyslogやSNMPトラップを上位の監視マネージャーやアプリケーションへの送信する機能です。日立製作所社のJP1、ヒューレット・パッカード社の Network Node Manager やOperations Software、IBM社のTivoli Netcoolなどのシステム監視ツールとOpManagerを併用している場合、監視工数の削減に役立てることができます。

SNMPトラップ送信

SNMPトラップ送信

しきい値に応じたアラート設定

「アラート通知」の詳細を見る

OpManagerは、様々なアラート処理をサポートしており、装置やサービスの停止時に管理者に通知します。加えて、装置やサービスの応答時間がある値を超えた場合にもアラート通知できます。管理者は応答時間やパフォーマンス監視項目にしきい値を設定し、そのしきい値条件の違反時にアラート通知します。

しきい値設定

しきい値設定

  • アラートに段階別のしきい値を設定(注意、警告、重大)
  • リアーム値(しきい値違反を解除する値)を指定
  • アラート内容の確認
  • メンテナンス設定
  • エスカレーションルールの定義

Windowsイベントログ監視

「Windowsイベントログ監視」の詳細を見る

  • 標準およびカスタムのWindowsイベントログを監視
  • イベントを無視する設定も可能
イベントログルール管理

イベントログルール管理

Syslog監視

「Syslog監視」の詳細を見る

  • Syslogを監視
  • 重要度に応じてアラートを発生
Syslogルール

Syslog監視

ITワークフロー

「ITワークフロー」の詳細を見る

ネットワークの運用管理におけるルーチンワークを、自動的に実行する機能です。ネットワーク障害の一次対応や、周期作業の自動化に活躍します。装置、Windowsサービス、プロセス、HTTP、FTP、ファイル、フォルダー、VMwareサーバーなどに対するタスク設定に対応しています。

ITワークフロー設定画面

ITワークフロー設定画面

関連動画