サーバー監視とは?

サーバー監視とは、サーバーのCPU・メモリー・ディスクなどのリソース使用率、起動状態、ログ情報などをリアルタイムで継続的に計測・記録し、異常を検知した際に管理者へ即時通知する一連の運用管理プロセスです。

社内で稼働しているサーバーやデータセンターにあるサーバー、クラウド上にあるサーバーを監視することが多いです。監視しているサーバーに異常が発生していることを検知したら、サーバー管理者に知らせることができる体制が整っていることが理想です。

サーバー監視は、サーバー管理の基本的な作業の1つです。重要なサーバーは、サーバー管理者が常に稼働状況を把握しておく必要があります。

 

サーバー監視で見るべき項目とは?

サーバー監視において監視すべき項目はそのサーバーの用途によって異なりますが、大抵の場合、以下の4項目に大別されます。

サーバーの起動状態(死活監視)

サーバーの起動状態を監視することを、サーバーの「死活監視」と呼びます。

サーバーが起動しているか否かはシステムの稼働状況に大きく影響を及ぼすと言えます。サーバー1台だけで稼働しているシステムにおいてのサーバーダウンはシステム停止を意味する大変深刻な状況です。
また、複数サーバーで構築されているシステムにおいても、1台のサーバーが停止すると他のサーバーに負荷を掛けることとなります。

サーバーが稼働しているかどうか、サーバーが万が一停止してしまった場合は直ちに管理者に知らせるような監視体制を整えておくことが望ましいと言えます。

サーバーの起動時間

サーバーの起動時間は、そのサーバーが最後にシャットダウンから起動、または再起動してから経過した時間のことです。

長時間稼働し続けているサーバーは、内部のアプリケーションの稼働状況などによりゾンビプロセスが生まれたり使用していないメモリーが確保され続けてメモリー使用率が逼迫したりなどの問題が発生する場合があります。

また、再起動が必要なOSのアップデートファイルが適用完了されておらず脆弱性が放置されるなど、セキュリティ的な問題が生じる場合もあります。

サーバーの起動時間を確認し、意図した範囲での稼働時間となっているかどうかを確認しましょう。

リソース監視

サーバーOSのCPU・メモリー・ディスク使用率などは、サーバーが稼働する上で必ず見るべき項目です。

基本的でシンプルな項目ですが、CPU使用率やメモリー使用率が高騰するとシステム応答の遅延に繋がったり、アプリケーションが停止してしまう可能性があります。

また、ディスク使用率の逼迫は、システムやアプリケーションの重要なファイルの破損に繋がる可能性もあります。

基本的な項目といえども疎かにせず、必ず注視しましょう。

イベントログ、Syslog監視

OSが稼働した状況や証跡を残すイベントログやSyslogを監視することは、サーバーの稼働状況が正常かどうかを判断する根拠となるほか、セキュリティの観点でサーバーの安全が脅かされていないかを判断することができます。
イベントログやSyslogは膨大な量のログが常に生成されます。これまでに挙げた監視項目の中でも、特に目視で監視することが難しい項目となりますので、専用のツールなどを用いて監視することがおすすめの項目となります。

Webサーバー向けのサーバー監視項目

また、サーバーの用途によって、上記に挙げた項目の他に監視項目を追加する必要がある場合があります。

ここからは、Webサーバーとして使用されるサーバーで、既に挙げた項目以外で監視すべき項目を掲載します。

稼働しているサービスやプロセスの状態

Webサーバーとして稼働するサーバーにおいて重要な監視項目は、Webサーバーのアプリケーションやその他、Web上に公開するWebサイトやWebサービスが正常稼働するために必要なOSのサービスやアプリケーションプロセスが全て正しく稼働しているかを把握することです。

必要なプロセスが停止したりサービスが中断されたりすると、Webアプリケーションの稼働に影響を及ぼします。

また、サーバー全体のリソース不足を防ぐためにプロセスごとのリソース使用率を監視し、プロセスが必要以上にリソースを消費していないかを確認することも大切です。

ログ監視

Webサーバーでは、前述のサーバーOSのイベントログ/Syslogの他、Webサーバーが生成するログを監視しておくことが大切です。

例えば、Webサーバーのアクセスログを監視することで、Web上に公開したサービスやアプリケーションが不正な攻撃を受けていないかなどを監視し、必要に応じて適切な対処をすることができるようになります。

 

サーバー監視に関するよくある質問

サーバー監視で最初に確認すべき項目はどれですか?

最初に確認すべきは「起動状態(死活監視)」です。サーバーがそもそも稼働しているかどうかを把握することが、すべての監視の前提となります。次いで、CPU・メモリー・ディスクのリソース使用率を監視することが推奨されます。

サーバーの起動時間はなぜ監視する必要があるのですか?

長時間稼働し続けたサーバーは、ゾンビプロセスの発生やメモリー使用率の逼迫が起きやすくなります。また、 再起動が必要なOSアップデートが未適用のまま放置され、セキュリティ上の脆弱性が残るリスクもあります。

サーバー監視は専用の監視ツールなしで行えますか?

コマンドラインやOSの標準機能でも一部の監視は可能ですが、イベントログやsyslogは膨大な量が生成されるため、目視での継続的な確認は現実的ではありません。複数サーバーを効率よく監視するには、 専用の監視ツールの導入が強く推奨されます。

サーバー監視ツールは専門知識がないと使いこなせませんか?

専門知識がなくても使える監視ツールは存在します。例えばOpManagerは、インストールから最短10分でサーバー監視を始められます。日本語ドキュメントと技術サポートも充実しているため、ITの専門担当者がいない中小規模の組織でも運用しやすい設計です。

 

サーバー監視に必要な項目を自動で監視する国内No.1*ツール

ManageEngineではネットワーク統合監視ツール「OpManager」を提供しています。 OpManagerは、さまざまなベンダー(メーカー)の物理サーバーやクラウドサーバー、ネットワーク機器などを管理・監視することができます。 Ping監視やSNMPやWMIなどのプロトコルを使った死活監視・パフォーマンス監視、可視化のためのマップ機能などもオプション課金なしにご利用いただけます。低価格で誰でも使えるユーザーインターフェースが特徴で、特別な知識や経験がなくてもすぐにネットワーク統合監視を始めることができます。

また、アプリケーション監視ツール、トラフィック監視ツールも統合し、すべての機能を1つの画面上から使用することも可能です。無料でもご利用いただけますので、是非お気軽にお試しください。

*デロイト トーマツ ミック経済研究所「ミックITレポート2024年11月号 中規模・小規模向けサーバ・ネットワーク統合監視ソフトウェア市場調査」より

ネットワークをわかりやすく可視化して異常を発見

ネットワークをわかりやすく可視化して異常を発見

 

関連ページ