Linux/UNIXサーバー監視

概要

ManageEngine® Applications Managerは標準でLinuxやUNIXのサーバー監視の機能を備えています。オペレーション チームはサーバーのアップをpingで確認できるだけでなく、CPU利用率メモリ利用率プロセスディスク利用率ディスクI/O統計を監視して、サーバーをピーク パフォーマンスで稼働させることができます。

新規Linux監視を作成するには

  1. 監視のモードを選択します(Telnet、SSH、SNMP)。IBM AIX、HP-UX、Tru64 UNIXではTelnetSSHのみをサポートします。Novell UNIXの場合は、SNMPのみがサポート対象です。
  2. Telnetの場合、サーバーのポート番号(デフォルトで23)と、ユーザー名・パスワードを入力してください。
  3. SSHの場合、サーバーのポート番号(デフォルトで22)と、ユーザー名・パスワードを入力してください。任意で公開鍵認証も可能です(ユーザー名と秘密鍵)。秘密鍵を守るためのパスフレーズも指定できます。

    メモ:公開鍵や秘密鍵を探すには、コマンド プロンプトへ移動し、cd.SSHと入力して、リストからファイル<id_dsa.pub>/<id_rsa.pub>[Public]か、<id_dsa>/<id_rsa>[Private]を開いてください。

  4. SNMPの場合、実行ポート(デフォルトで161)とSNMPコミュニティ文字列(デフォルトで「public」)を指定します。ユーザー名とパスワードは不要です。
  5. Telnet/SSHモードで監視するには、コマンド プロンプト値を指定してください(コマンド プロンプトの最後の文字)。デフォルトでは$となっており、>、#なども指定できます。

    メモ:SSHで監視するサーバーでデータ収集を行うには、パスワード認証変数を「yes」にセットします。/etc/ssh/sshd_configファイルを開き、パスワード認証変数の値を確認ください。「no」にセットされている場合は、「yes」に変え、コマンド/etc/rc.d/sshd restartでSSHデーモンを再起動する必要があります。
  6. 監視を関連付ける監視グループを、コンボボックスで選択します(任意項目)。
  7. 監視の追加をクリックすると、ネットワークからホストやサーバーを検出し、監視を始めます。

監視対象のパラメーター

Applications Managerは、LinuxサーバーのKPIを監視し、パフォーマンス低下を検知します。KPIにはCPU、メモリ、ディスクなどがあります。

  • 可用性タブは、過去24時間か30日のLinuxサーバーの可用性履歴を示します。
  • パフォーマンス タブでは、物理メモリ利用率、CPU利用率、応答時間、スワップ メモリ利用率など、LinuxサーバーのKPIを、これら属性のヒート チャートとあわせて表示します。過去24時間か30日のステータスとイベントも提示します。
  • リスト ビュー タブでは、Applications Managerが監視するApplications Managerが監視するLinuxサーバーすべてを、その可用性とステータス全般とあわせて表示します。一括管理設定も可能です。

リストにあるそれぞれの監視をクリックすると、詳細なパフォーマンス メトリックが表示されます。パフォーマンス メトリックは、6つのタブに分類されています。

*ネットワーク インターフェース詳細は、SNMPモードで追加したLinuxリソースでのみ監視できます。

概要

このタブでは、Linuxサーバーのステータスとパフォーマンス全体像を、システムで実行中のプロセスやサービスの情報とあわせて提示します。

パラメーター 説明
監視情報
名前 Linuxサーバー監視の名前です。
システム ステータス Linuxサーバー(クリア、警告、重大)のステータスを表します。
タイプ 監視しているリソースのタイプを表します。
ホスト名 Linuxシステムのホスト名です。
ホストOS システムにインストールされているメインOSを指します。
最新ポーリング時刻 最新のポーリングを実行した時刻を指します。
次回ポーリング時刻 次回のポーリングをスケジュールした時刻を指します。
本日の可用性 サーバーの当日分の可用性ステータス全般を示します。サーバーの7/30レポートと現在の可用性ステータスも表示できます。
パラメーター 説明
スレッド数 Linuxマシンで実行中のスレッドの数を示します。
プロセス数 プロセスの数です。起動プロセス数が多すぎるとサーバーのパフォーマンスが低下します。プロセス数が上昇し始めたら、問題発生前の予兆の段階で対処するよう警告をあげると有用です。
ゾンビ プロセス数 ゾンビ プロセスの数です。ゾンビ プロセスは制御不能のままポートを空け続けることがあります。ゾンビ プロセスが発生したら確認し、問題発生前の予兆の段階で対応できるようにしておくと、有用です。

「監視情報」セクションのカスタム フィールドでは、監視に追加フィールドの設定が可能です。

概要タブでは、CPU、メモリ、ディスクの利用率ダイアルを表示します。ダイアルをクリックすると、属性の詳細が図表で表示されます。グラフは履歴レポート、時間帯別レポート、曜日別レポート、ヒート チャートでご利用いただけます。グラフは、リアルタイム データでも履歴データでも作成可能です。

CPUとメモリの利用率(最新6時間)グラフは、最新6時間のメモリ・CPU利用率を表示します。提示する属性は、スワップ メモリ利用率、物理メモリ利用率(%、MB)、CPU利用率(%)です。

CPU利用率の内訳グラフでは、システム プロセッサー全体のパフォーマンス メトリック内訳を、実行キュー、ブロックされたプロセス、ユーザー時間(%)、システム時間(%)、I/O待機時間(%)、アイドル タイム(%)、割り込み(数/秒)などの属性で示します。

システム負荷グラフでは、システムが実行する作業の量がわかります。最新1分・5分・15分のシステム負荷は、それぞれ1分間・5分間・15分間でのジョブなどのパラメーターで提示します。

プロセス詳細のセクションでは、Linuxサーバーで実行中のプロセスの情報が表示されます。プロセス監視の追加は、新規プロセスの追加オプションで可能です。不要なプロセスの削除や、プロセスごとのレポート有効化/無効化もできます。表示された属性をクリックすると、それぞれの情報がより詳しく表示されます。

当該システム内の監視のセクションでは、該当するサーバーに設定した監視の可用性とステータスがわかります。監視するリソースを追加するには、監視の追加をご利用ください。

CPU

このタブではLinuxサーバーのCPU利用率統計を表示します。タブには2種類のグラフがあります。1つはCPU利用率(コアごと)で、もう1つはCPU利用率の内訳(コアごと)です。追加レポートを表示するには、CPU利用率の内訳(コアごと)にあるグラフをクリックしてください。全コアのCPU利用率の内訳(%)、ユーザー時間(%)、システム時間(%)、I/O待機時間(%)、アイドル タイム(%)、CPU利用率(%)、割り込み(数/秒)がわかります。

CPUタブでは次のパフォーマンス メトリックも表示しています。

パラメーター 説明 監視モード
Telnet/SSH SNMP
コア CPUコアの名前です。
ユーザー時間(%) プロセッサーがユーザー モードの作業に費やした時間の割合を表します(%)。これは主に、アプリケーション コードの負荷を指します。
対応
対応
システム時間(%) 利用中のCPUカーネル プロセスの割合を表します(%)。
対応
対応
I/O待機時間(%) プロセッサーがI/O処理完了を待機していた時間を表します。
対応
対応
アイドル タイム(%) CPUがアイドルの時間です。どのプログラムもCPUを使っていない状態を表します。
対応
対応
CPU利用率(%) システムが利用しているCPU総量を示します。
対応
対応
割り込み/秒 CPUがアプリケーションやハードウェアからの割り込みに対応する、ペースを指します(数/秒)。割り込みの値が定常的に高い場合は、ハードウェアの問題が考えられます。
対応
対応

これら属性のグラフを表示するには、CPUコアを選び、続いて属性を選択ください。

ディスク

このタブでは、Linuxサーバーによるディスクの利用率とディスクI/Oの統計を表示します。

パラメーター 説明
ディスク利用率
ディスク ディスク ドライブの名前です。
利用済み(%) 総ディスク スペースのうち実際に利用されている量の比率を表します(%)。
利用済み(MB) 利用中のディスク スペースを指します(MB)。
空き(%) 空きヒープ メモリの割合を表します(%)。
空き(MB) ディスクに存在する未割り当てのスペースを指します(MB)。
ディスクI/O統計
転送/秒 ディスクでの読み書き操作の発生速度を差します(数/秒)。
書き込み/秒 ディスク ドライブが書き込みリクエストへの対応でビジーであった時間の比率を指します(%)。
読み込み/秒 ディスク ドライブが読み込みリクエストへの対応でビジーであった時間の比率を指します(%)。
ビジー時間(%)[% Busy Time] ディスクがビジーであった時間の割合を表します(%)。
平均キュー長 サンプル期間中、ディスク向けにキューイングされていた読み書き双方のリクエスト数平均を指します。
inode利用率
inode inodeの名前です。
合計 inode特定ディスクに存在するの総数です。
利用 ディスク ドライブが読み込みリクエストへの対応でビジーであった時間の比率を指します(%)。
空き 特定ディスクに残存しているinodeの数を表します。
利用済み(%) 特定ディスクで利用中のinodeの数です。(%)。
空き(%) 特定ディスクに残存しているinodeの数を表します(%)。

物理的に取り外したディスクの削除も、孤立したディスクの削除で可能です。

メモ:ディスクI/Oとinodeの統計データ収集を有効にするには、「ディスクI/O統計監視」と「inode監視」を、管理 > パフォーマンス ポーリング >サーバー タブで有効にしてください。

cronジョブ

cronジョブはLinuxで、バックアップ、メール、ステータス チェックなどのタスクのスケジュールに利用されます。Webサーバーやアプリケーションのパフォーマンスに、重大なインパクトがあることも珍しくありません。Applications Managerの利用でcronの継続監視は容易となり、バックエンド システムでの重要ジョブ実行状況がわかります。

cronジョブ監視を追加する

要件当社製品要件の該当機能の解説をご確認ください。

  1. cronジョブ タブへ移動し、cronジョブの追加をクリックしてください。
  2. 次の詳細を入力してください。
    • 表示名:ユーザーにわかりやすい名前をつけます。
    • cron式:cronジョブのスケジュール設定に使う表現です。
    • タイムゾーン:リモートLinuxマシンに設定したタイムゾーンで、ドロップダウンから選択できます。
    • ジョブ スクリプト パス:cronジョブ実行に必要なスクリプトの完全パスです。
    • cronジョブ期間:ジョブ完了までの許容時間です(分)。設定時間を超えると、ステータスは実行時間超過に更新されます。
  3. cronジョブ監視を追加すると、cronジョブの下にcurl情報が表示されます。クリックでcurl情報をコピーできますので、そのち、ウィンドウを閉じてください。これによって、cronジョブ タブへ自動的にリダイレクトされます。
  4. リモートLinuxマシンで、コマンド プロンプトを開き、コマンドcrontab -eを実行します。これにより、crontabが編集モードで開きます。以前コピーしたcron情報を貼り付けてから、保存して閉じてください。

次の表では、Linuxサーバーで実行中のcronジョブの詳細を説明します。

パラメーター 説明
cronジョブ詳細
cron名 cronジョブの名前です。
cron式 cronジョブに対応するcron式です。
ジョブ起動時刻 cronジョブ開始の日時を表します。
ジョブ終了時刻 cronジョブ終了の日時を表します。
次回実行時刻 次回cronジョブの実行をスケジュールした日時を示します。
経過時間 cronジョブ開始以来のの経過時間です(分)。
終了コード cronジョブの終了コードを表します。
実行失敗 cronジョブがスケジュール時刻に実行失敗した回数を指します。
ステータス cronジョブのステータスです。ステータスは次のものがあります。
  • 成功(PASSED):ジョブ実行に成功し、終了コードは0となります。
  • 実行中(RUNNING):ジョブが実行中であることを指します。
  • 失敗(FAILED):ジョブに失敗し、終了コードは0より上となります。
  • 実行時間超過(EXCEEDJOBTIME):ジョブが指定時間を超えて実行されています。

メモ:cronジョブを追加すると、リモート サーバーから最初のレスポンスがあるまで、ディスカバリ中のステータスとなります。

cronジョブを更新するには

cronジョブを更新するには、次の手順で操作します。

  1. cronジョブのアイコンを選び、編集をクリックします。
  2. cronジョブの表示名cronジョブ期間を入力してください。
  3. 更新をクリックします。

cronジョブを削除する

cronジョブを削除するには、

  1. 削除するcronジョブを選択してください。
  2. cronジョブの削除をクリックします。これによりApplications Managerからcronジョブが削除されます。
  3. 最後に、リモート サーバーのcronジョブに追記(append)したcurlを、crontab -eコマンドで削除してください。

メモ:cronジョブの追加、更新、削除は、管理者により、管理対象サーバーにのみ実行可能です。

ネットワーク(SNMPモードのみ)

ネットワーク インターフェース

パラメーター 説明
ネットワーク インターフェース
名前 Linuxシステムに存在するネットワーク インターフェースの名前です。
速度(MB/秒) 現在の推定帯域を示します(MB/秒)。
受信トラフィック(KB/秒) インターフェースでのパケット受信速度をデータ量で表します(KB/秒)。
送信トラフィック(KB/秒) インターフェースでのパケット送信速度をデータ量で表します(KB/秒)。
エラー 送受信できなかったパケットの数を指します。

メモ

  • ネットワーク インターフェース詳細は、SNMPモードで追加したLinuxリソースでのみ監視できます。
  • 物理的に取り外したインターフェースは、孤立したインターフェースの削除で削除できます。

設定

このタブではシステム設定属性の情報を表示します。

パラメーター 説明
システム情報
ホスト名 システムの名前です。
ドメイン システム所属先のドメインの名前です。
OS情報
OS名 OSインスタンスの名前です。
OSバージョン OSのバージョン番号です。
OSリリース Linuxディストリビューションを指します。
メモリ情報
総物理メモリ(MB) OSで利用できる物理メモリの総量です。
総スワップ メモリ(MB) 利用できるスワップ メモリの総量です。
プロセッサー情報
ID システムにあるプロセッサーの一意の識別子です。
モデル プロセッサー モデルタイプを指します。
インプリメンテーション プロセッサー ファミリー タイプを指します。
製造者 プロセッサー製造者の名前です。
速度(MHz) プロセッサーの現在の速度です。
キャッシュ(KB) プロセッサー キャッシュのサイズです。メイン メモリよりアクセスの速い外部メモリを指します。
ネットワーク インターフェース設定
名前 ネットワーク アダプターの名前です。
IPアドレス 当該ネットワーク インターフェースに設定されているIPアドレスを指します。
MTU 利用中のネットワーク メディアのタイプです。
タイプ ネットワーク アダプターのタイプです。
MACアドレス ネットワーク アダプターのMACアドレスを指します。MACアドレスは一意の48ビットの数値で、ネットワーク アダプターに製造者が割り振ります。ネットワーク アダプターの特定や、TCP/IP通信へのマッピングに使われます。
ステータス ネットワーク アダプターの現在のステータスです。
ブロードキャ ストア ドレス メッセージのブロードキャスト先IPアドレスです。
プリンター設定
名前 プリンターの名前です。
装置 プリンターを制御するサーバーの名前です。
デフォルト プリンターがデフォルトのものかを示します。値はTrueかFalseです。
ステータス プリンターの現在のステータスです。

メモ:設定タブにある情報は、ポーリングのたびに更新されるわけではありません。サーバー設定を変更した場合、変更をただちに「設定」タブに反映させるには、Applications Managerを再起動してください。

ハードウェアのメトリック

以下、DellとHPのサーバー製品にかかわるハードウェア メトリックを説明します。

 
カテゴリ 属性 説明 Dell HP
SNMPモード WMIモード SNMPモード WMIモード
温度 センサー 温度センサーの名前です。
対応
未対応
対応
未対応
温度読み込み(摂氏) 現在の温度読み込み
対応
未対応
対応
未対応
ステータス 温度のステータスを指します(重大、警告、クリア)。
対応
未対応
対応
未対応
ファン センサー ファン センサーの名前です。
対応
未対応
対応
未対応
ファン速度(RPM) ファン回転速度を表します(分ごと回転数:Rounds per Minute)。
対応
未対応
対応
不可
ステータス ファンのステータスを指します(重大、警告、クリア)。
対応
未対応
対応
未対応
電源 センサー 電源の名前です。
対応
未対応
対応
未対応
読み込み(ワット) 電源読み取り値を表示します(ワット)。
対応
未対応
対応
未対応
ステータス 電源のステータスを指します(重大、警告、クリア)。
対応
未対応
対応
未対応
電圧 センサー 電圧供給の名前です。
対応
未対応
不可
不可
読み込み(ボルト) 電圧読み取り値を表示します(ボルト)。
対応
未対応
不可
不可
ステータス 電圧のステータスを指します(重大、警告、クリア)。
対応
未対応
不可
不可
バッテリ センサー バッテリ センサーの名前です。
対応
不可
対応
不可
ステータス バッテリのステータスを指します(重大、警告、クリア)。
対応
不可
対応
不可
メモリ センサー メモリ センサーの名前です。
対応
未対応
対応
未対応
メモリ装置タイプ メモリ装置のタイプです。
対応
未対応
不可
未対応
サイズ(MB) 現在インストールされているメモリの量を指します(MB)。
対応
未対応
対応
未対応
ステータス メモリのステータスを指します(重大、警告、クリア)。
対応
未対応
対応
未対応
ディスク センサー ディスク ラベルを識別できます。
対応
未対応
対応
未対応
装置名 ディスクに設定した装置名を指します。
対応
未対応
不可
不可
サイズ(MB) 割り当てサイズを示します(MB)。
対応
未対応
対応
不可
ステータス ディスク ステータスを表します(重大、重要、クリア)。
対応
未対応
対応
未対応
アレイ センサー アレイ ディスクの名前です。
対応
不可
対応
未対応
バス プロトコル アレイ ディスクのバスタイプを指します。
対応
不可
不可
不可
サイズ(MB) アレイ ディスクの利用量を指します(MB)。
対応
不可
対応
不可
ステータス アレイのステータスを指します(重大、警告、クリア)。
対応
不可
対応
未対応
シャーシ センサー ユーザーがシャーシに付けた名前です。
対応
未対応
対応
未対応
モデル シャーシのシステム モデルタイプです。
対応
未対応
対応
未対応
ステータス シャーシのステータスを指します(重大、警告、クリア)。
対応
未対応
対応
未対応
プロセッサー センサー プロセッサー装置ステータス プローブのロケーション名です。
対応
未対応
対応
未対応
プロセッサー ブランド プロセッサー装置のブランドです。
対応
未対応
対応
未対応
プロセッサー現在の速度 プロセッサー装置の現在の速度です(MHz)。
対応
未対応
対応
未対応
プロセッサー コア数 プロセッサー装置で検出したコアの数を指します。
対応
未対応
対応
未対応
ステータス プロセッサー ステータスを表します(重大、警告、クリア)。
対応
未対応
対応
未対応
  • コンポーネントが正しく機能していれば、ステータス インジケーターは緑です。
  • システム コンポーネントがパフォーマンスしきい値を超過したり、適切に機能していない場合、ステータス インジケーターはオレンジか赤に変わります。一般的に、インジケーターがオレンジとなるのは、パフォーマンス低下の際です。
  • インジケーターが赤であれば、コンポーネントは停止しているかしきい値を超過しています。
  • ステータスが空白であれば、コンポーネントのステータスを判定できない状態です。

メモ:現在、ハードウェア パフォーマンス監視は、SNMPモードとWMI監視モードでサポートしています。

ハードウェア装置レベル設定

詳細ページ右側のホスト詳細にあるハードウェア設定では、監視する各種のハードウェア コンポーネントを選択できます。この操作は、管理タブのパフォーマンス ポーリング空も可能で、管理タブではハードウェア統計をグローバルに設定いただけます。

詳細設定

詳細ページ右側のホスト詳細から詳細設定をクリックすると、サーバーのパフォーマンス データ収集ページへ移動できます。

ハードウェア ステータス監視では、サーバーのハードウェア監視を有効・無効にできます。表示されるハードウェア コンポーネントも、選択して監視可能です(電源、ファン、ディスクなど)。こちらでの設定は、ハードウェア監視にグローバルに反映されます。値をそれぞれのテキスト ボックスで定義して、ステータス設定もできます。

  • 重要度「重大」:ステータスが、重要度「重大」のテキスト ボックスで定義した値いずれかに該当すれば、Applications Managerはハードウェア装置のステータスを重大と表示します。デフォルトでは、サーバー ハードウェアのメーカーが定義する故障、エラー、障害、回復不能、致命的上限、致命的下限、回復不能下限、致命的(failed、error、failure、nonRecoverable、criticalUpper、criticalLower、nonRecoverableLower、critical)を、Applications Managerの「重大(critical)」にマッピングします。
  • 重要度「警告」:ステータスが、重要度「警告」のテキスト ボックスで定義した値いずれかに該当すれば、Applications Managerはハードウェア装置のステータスを警告と表示します。デフォルトでは、サーバー ハードウェアのメーカーが定義する性能低下、警告、非致命的、非致命的下限、回復不能上限、非致命的下限(degraded、warning、nonCritical、nonCriticalUpper、nonRecoverableUpper、nonCriticalLower)を、Applications Managerの「警告(warning)」にマッピングします。
  • 重要度「クリア」:ステータスが、重要度「クリア」のテキスト ボックスで定義した値いずれかに該当すれば、Applications Managerはハードウェア装置のステータスをクリアと表示します。デフォルトでの設定値は「OK」です。
  • メモ:装置のステータスが、重要度のテキスト ボックスの指定値にマッチしなければ、装置ステータスは不明と表示されます。重要度に指定するステータス値は、カンマ区切りで、大文字小文字を区別します。