ワークフロー機能による、NCMコンフィグバックアップ失敗時の調査用情報の自動収集と通知
対象
・OpManager Plus
・OpManager + Network Configuration Manager(統合利用)
バージョン12
以降、各製品名を以下のように記載します。
OpManager→OPM
Network Configuration Manager→NCM
概要
NCM機能で管理対象装置のコンフィグバックアップに失敗すると、バックアップ失敗に関するアラートが発報されます。
※アラートには、バックアップが失敗した装置とその時刻情報のみが含まれます。
本ナレッジではOPMとNCMを統合利用するユーザー様を対象に、
コンフィグバックアップの失敗をトリガーとしたトラブルシューティング時に必要な、情報の収集と通知を自動化する方法を記載します。
「ワークフロー機能」を使用して原因の切り分けに必要な情報を自動収集することで、「調査の一次対応」を迅速化します。
本ナレッジに記載の機能や方法は、トラブルシューティングを行う上での一例です。
ご利用環境における原因特定を保証するものではありませんので、ご留意ください。
ご利用環境における原因特定を保証するものではありませんので、ご留意ください。
設定手順
- OPMにログインし、[ワークフロー]→[新規ワークフロー]をクリック
- 画面左のアクション一覧より、以下のアクションをドラッグ&ドロップで配置
・装置へのPing(装置)
・Traceroute(装置)
・コマンド実行(NCMアクション)
・メール送信(外部アクション)
※[メール送信]ではワークフローで実行した内容とその結果をメール通知します。メールサーバー設定を事前に設定してください。
- 画面右上の[次のステップ]をクリック
- ワークフローの対象とする装置を選択し、[次へ]をクリック
- [アラートをトリガーにして実行]より、以下のトリガーを選択し、[次へ]をクリック
・コンフィグバックアップに失敗したとき
- ワークフローの名前を任意に入力し、[保存]をクリック
※遅延実行や繰り返し実行などのオプションは任意に設定してください。
手順2の「コマンド実行」では例として、Cisco装置を対象に以下のshowコマンドを設定しています。
※[NCMアクション]→[テンプレートの実行]を選択して、コンフィグレット機能で設定したコマンドを実行することも可能です。OPMの画面では、[設定]→[コンフィグ管理]→[コンフィグレット]より設定します。
- show env all:ファンや温度の状態を取得します。
- show process cpu:過去5秒間、1分間、5分間のCPU使用率を取得します。
- show process cpu history:過去1分間、1時間、72時間のCPU使用率を取得します。
- show process memory:アクティブなプロセスと使用メモリの情報を取得します。
本例のポイント
- Ping疎通が不可の場合、「Traceroute」で経路の到達状況を確認します。
- Ping疎通が可能な場合、showコマンドの実行により、対象装置の直近の負荷状況を収集します。
※OPMの「監視のしきい値設定」により、メモリやCPU使用率のしきい値を事前に設定し、予兆検知を行うことも可能です。
※「トラフィック分析により高負荷な通信を可視化、特定したい」という要件の場合、OPMと統合利用可能な製品「NetFlow Analyzer」のトラフィック監視機能の利用をご検討ください。 - showコマンドの実行でエラー(実行失敗)が発生する場合、NCMで設定している認証設定に誤りがある可能性があります。
ワークフロー実行時の挙動と収集情報
指定したトリガー「コンフィグバックアップに失敗したとき」が発生すると、ワークフローが自動で実行されます。
実行内容は、以下のいずれかより確認します。
対象装置の現在の状況を効率的に自動収集し、トラブルシューティングの迅速化にお役立てください。
- NCM単体の場合、[ツール]→[ワークフロー]機能からワークフローを設定できますが、上記例に記載の「外部アクション(メール通知)」は実装されておりません。
代替案として、スケジュールバックアップ機能でバックアップの失敗の通知を受信し、NCMのワークフローログからコマンド等の実行結果を確認する案がございます。 - OPMの「ワークフロー機能」では、コンフィグバックアップ失敗以外にも、
コンフィグ変更をトリガーに特定のアクションを実行することができますので、そちらもぜひお試しください。