死活監視とは?簡単に複数ノードの監視を自動化する方法

サーバー・ネットワーク統合監視

死活監視とは?

死活監視とは、ネットワーク内に配置した機器やサーバー・システムといった各ノードが意図通りに稼働しているか、外部から監視することを指します。死活監視により、システムの可用性を確認できることから可用性監視とも呼ばれます。

死活監視を簡単に実現できる方法としてはPing(ピング)コマンドが最も有名です。Pingは、可用性を確認したい機器やサーバーにICMP(Internet Control Message Protocol)プロトコルでパケットを送信します。Pingを受けた機器やサーバーが稼働していれば、送信元に対して返事となるパケットを送信します。

Ping応答の可否を監視することで、監視対象の機器が稼働しているかどうかを判別できます。そのため、コマンド名やプロトコル名を取ってPing監視やICMP監視と呼ばれることもあります。

死活監視の必要性

24時間365日稼働が当たり前となったネットワークにおいて、システムやネットワーク・サービスのダウンタイムは、ビジネスにおける大きな損失となります。企業の規模に関わらず、ネットワークとサービスの可用性を高く保つことは重要です。

また、Pingコマンドによってサーバーの稼働が確認できても、サーバー内で稼働するサービスがダウンしている場合、システムが稼働しなくなることがあります。ネットワークの状況・サーバーの稼働状況・サービスの稼働状況など、一言でシステムの可用性監視と言っても、管理者が見るべき箇所は非常に多岐にわたります。場合によっては、これらの確認には技術的な知識を必要とします。

可用性維持のためには、常にシステムの稼働状況を把握することが有効となります。しかし、ネットワーク内の全ての機器について、可用性維持のために監視すべき項目は膨大です。これらを24時間365日、人力で監視するのは現実的ではありません。

そのため、多くの管理者が必要な監視をツールで自動化しています。

死活監視を簡単に自動化するツール

ManageEngineが提供するOpManagerも死活監視を自動化するツールのひとつです。ICMPプロトコルによるネットワーク機器やサーバーの死活監視を自動化します。

無料で使えます[機能・監視数 無制限]

ダウンロードはこちら概要資料はこちら

死活監視機能

OpManagerは、企業や組織内のネットワーク機器やサービスが確実に24時間365日稼働するための可用性監視機能を備えています。また、スイッチ・ルーター・サーバー等の機器へのきめ細かい監視を実施し、ネットワーク機器やシステム・サービスの可用性を、統計情報として簡単に可視化できます。

サーバー・ネットワーク機器の可用性監視

OpManagerは死活監視として、一定間隔で監視対象の機器にPINGを送信します。OpManagerからのPG送信に対し、連続して応答がない場合、その回数に応じて対象の機器が利用不可であると判断します。PINGの回数と送信間隔は、ニーズに合わせて変更可能です。

ネットワーク機器の可用性監視(死活監視)ネットワーク機器の可用性監視(死活監視)レポート
アイコンステータス意味
Attention注意(Attention)デバイスへのポーリングに1回未応答
Trouble警告(Trouble)デバイスへのポーリングに連続3回未応答
Critical重大(Critical)デバイスへのポーリングに連続5回未応答
Criticalクリア(Clear)デバイスへのポーリングに応答有り(通常状態)
OpManagerの死活監視におけるアラート通知と重要度を示す表示マーク

ICMP PINGが利用できない環境で、エッジルーターやDMZゾーンのデバイスの稼働状況を監視する場合は、 代わりにTelnetを使用できます。

死活情報以外にも、可用性監視により次の4つのステータスを把握することができます。監視条件を把握することで、より正確な状況が判断できます。

ステータス監視条件による 活用シナリオ
保留中(On Hold)一時的にデバイスの監視を停止した場合に表示されます。障害対応のために頻繁にデバイスを再起動する必要が生じた場合などに、手動でOpManagerの監視を一時的に停止できます。
メンテナンス(On Maintenance)「メンテナンス中」を意味します。定期メンテナンスの間、デバイスをメンテナンスモード下に置くことができます。メンテナンスはOpManager内でスケジュールを設定することができます。言い換えれば、"On Hold"はそ一度きりの、”On Maintenance”は計画的な監視の停止を意味します。
依存関係ダウン(Dependent Down)「親ノード」のダウン/「子ノードのダウン」を意味します。デバイスの親ノードがダウンしたとき、それに属するデバイスへのポーリングを自動的に停止します。スパムメールの様に通知が届くのを回避します。

無料で使えます[機能・監視数 無制限]

ダウンロードはこちら概要資料はこちら

インターフェース/ポートの可用性監視

インターフェース/ポートの可用性監視

OpManagerはSNMPを使って、ネットワーク機器・サーバー等のインターフェースやポートの可用性も監視可能です。OpManagerの可用性レポートは、インターフェースの可用性を日別・週別・月別または指定した期間ごとにデータを表示できます。ネットワークの可用性の計測に役立ち、高いSLAを確実に提供するための指標として活用できます。

TCPサービスの可用性監視

TCPサービスの可用性監視

徹底的なサーバー管理の計画を行うには、システムレベルのサービスの可用性監視が重要です。OpManagerは可用性に関する詳細なグラフとレポートや、監視対象のTCPサービスのレスポンスタイムの情報を提供します。監視対象とするサービスは自由に選択することができます。

サービス監視の詳細

Windowsサービスの可用性監視

Windowsサービスの可用性監視

システムレベルサービスの監視に加え、OpManagerはWMIを使ったWindowsサービスの監視にも対応しています。システムレベルのサービス監視同様、あらゆるWindowsサービスの検出と監視が可能です。さらに、オペレーションコンソールでWindowsサービスがダウンしているのを発見した際は、自動的にサービスやサーバーを再起動することまで可能です。

Windowsサービスの可用性監視の詳細

Webサイトの可用性監視

Webサイトの可用性監視

OpManagerではWebサイトの可用性監視も実現可能です。HTTP URL、イントラネットのサイト、Webサーバー、Webアプリケーション、NTML認証のWebサイトなどが監視可能です。稼働状態の監視以外にも、特定のWebコンテンツの可用性を監視することも可能です。Webサイトの可用性監視によってWebサイトを常にアップの状態に保つことができ、ハッキングの危機にさらされるリスクを軽減することができます。

Webサイトの可用性監視の詳細

プロセスの可用性監視

プロセスの可用性監視

OpManagerのプロセス監視は、サーバー上で稼働しているプロセスの可用性を監視することができます。OpManagerは様々なプロトコルに対応しています。例えば、Windows、Linux、Solaris、UNIX、HP UX、IBM AIX、ESXやVMwareサーバーなどの仮想マシンなど上で稼働するプロセスをSNMP、WMI、CLIを使って測ります。さらに、障害原因となるプロセスを発見した際に、サーバーのクラッシュを防ぐためにもリモートから当該プロセスを終了することも可能です。

プロセス監視の詳細

無料で使えます[機能・監視数 無制限]

ダウンロードはこちら概要資料はこちら