Hadoop監視
Hadoopは,オープン ソースのソフトウェア フレームワークです。ビッグ データの分散ストレージと分散処理むけにデザインされています。Hadoopの主要アーキテクチャは、ストレージ部分と処理部分でできています。Hadoopはファイルを大きなブロックに分け,クラスター内ノードに分散させます。Hadoopは複数ノードにタスクを渡して並列処理を実行、データのローカル性を活かして高速かつ効率的に動作します(データはノードで集中処理され、やりとり遅延がありません)。Applications ManagerのHadoop監視では、Hadoop 1.xとHadoop 2.xの双方をサポート。Hadoop分散クラスターのステータス維持や、可用性の確保、タスクの高速・精密実行に役立ちます。
Hadoop監視を作成するには、次の手順に従ってください。
- 新規監視をクリックし、サービスからHadoopを選択します。
- 監視の表示名を入力してください。
- 監視のモードを選択します。
REST APIモードの場合:
- 監視するHadoopのバージョンを指定します。
- NameNodeのホストを指定します。
- NameNodeのWebポートを指定します。
- YesかNoで、SSLは有効か選択ください。
- 認証タイプを選択します。シンプル認証を選択する場合、ユーザー名を指定してください。
- リソース マネージャー ホストの名前を指定します。
- リソース マネージャーのWebポートを指定します。
- もう1度、YesかNoで、SSLは有効か選択ください。
- もう1度、認証タイプを選択します。シンプル認証を選択する場合、ユーザー名を指定してください。
- ポーリング間隔を指定します。
- コンボボックスで、監視を関連付ける監視グループを選択します(任意項目)。監視は複数グループに関連付け可能です。
- 監視の追加をクリックします。これによって、ネットワークから監視を検出し、監視を始めます。
- NameNodeのホストを指定します。
JMXモードの場合:
- 監視するHadoopのバージョンを指定します。
- NameNodeのホストを指定します。
- NameNodeのJMXポートを指定します。
- ユーザー名とパスワードを入力してください。
- NameNodeのJNDIパスを入力してください。
- リソース マネージャー ホストの名前を指定します。
- リソース マネージャーJMXポートを指定します。
- ユーザー名を入力し、パスワードをセットします。
- リソース マネージャーのJNDIパスをセットします。
- ポーリング間隔をセットします。
- コンボボックスで、監視を関連付ける監視グループを選択します(任意項目)。監視は複数グループに関連付け可能です。
- 監視の追加をクリックします。これによって、ネットワークから監視を検出し、監視を始めます。
- NameNodeのホストを指定します。
Hadoopサーバー:監視対象のパラメーター
監視タブをクリックして、監視カテゴリ ビューへ移動してください。サービス テーブルでHadoopを選ぶと、Hadoop一括設定ビューが3つのタブに分類・表示されます。
- 可用性タブでは、過去24時間か30日の可用性履歴がわかります。
- パフォーマンス タブでは、過去24時間か30日のステータスとイベントがわかります。
- リスト ビューでは、一括管理設定が可能です。
管理名をクリックすると、全サーバーの詳細が、以下のタブに表示されます。
Hadoop 1.x
| セーフ モード | |
|---|---|
|
セーフ モード ステータス |
セーフ モード ステータス ステータスには次のものがあります。 -Operational -Safemode |
| DFS | |
| 総DFS容量(GB) | HDFSの総容量です。 |
| 非DFS利用済みスペース(GB) | DFSコマンドを使わず利用されているHDFSメモリを指します。 |
| DFS利用済みスペース(GB) | DFSコマンドで利用されているHDFSメモリを指します。 |
| 利用済みDFS(%) | HDFSメモリの利用率を示します(%)。 |
| DFS空きスペース(GB) | HDFSの空きメモリです。 |
| DFS空き(%) | HDFSの空きメモリ比率を表します(%)。 |
| ブロック | |
| ブロック容量 | Hadoopの総ブロック容量です。 |
| 総ブロック | Hadoopにあるブロックの総数です。 |
| 欠落ブロック | Hadoopに欠落ブロックがいくつあるかを表します。 |
| 破損ブロック | Hadoopに破損ブロックがいくつあるかを表します。 |
| 過剰ブロック | Hadoopに過剰ブロックがいくつあるかを表します。 |
| 複製不足のブロック | Hadoopに複製不足のブロックがいくつあるかを表します。 |
| 削除保留ブロック | Hadoopに削除保留ブロックがいくつあるかを表します。 |
| 複製保留ブロック | Hadoopに複製保留ブロックがいくつあるかを表します。 |
| ファイル | |
| 総ファイルとディレクトリ | HDFSにあるファイルとディレクトリの総数を示します。 |
| ファイル/ディレクトリ作成(/秒) | ファイルやディレクトリの作成ペースを指します(数/秒)。 |
| 負荷 | |
| 総負荷 | Hadoopサービスへの総負荷を示します。 |
| NameNode JVM | |
|---|---|
| コミット済み非ヒープ メモリ | 現在、利用してよいものとコミットされている総非ヒープ メモリを示します。 |
| 利用済み非ヒープ メモリ | Currently used非ヒープ メモリ. |
| コミット済みヒープ メモリ | 現在、利用してよいものとコミットされている総ヒープ メモリを示します。 |
| 利用済みヒープ メモリ | 利用中のヒープ メモリを指します。 |
| NameNode OS | |
| 総物理メモリ(GB) | NameNodeの総RAMです。 |
| 空き物理メモリ(GB) | NameNodeの空きRAMです。 |
| 総スワップ スペース(GB) | NameNode OSで利用できるスワップ総容量を表します。 |
| 空きスワップ スペース(GB) | NameNode OSで利用できる空きスワップ スペースを表します。 |
| 最大ファイル デスクリプター数 | 総ファイル デスクリプター容量 |
| オープンファイル デスクリプター数 | ステータスがオープンのファイル デスクリプターの数です。 |
| 平均システム負荷 | NameNode OSでの平均負荷を表します。 |
| DataNode | |
| ノード名 | DataNodeの名前です。 |
| ステータス | NameNodeの現在のステータスを指します。
|
| 利用済みスペース(GB) | HDFSで利用中のスペースを指します。 |
| トラッカーサマリ | |
|---|---|
| 総TaskTracker | TaskTrackerの総数です。 |
| アライブTasktracker | ステータスがアライブのTaskTrackerの数を示します。 |
| ブラック リスト入りTaskTracker | ブラック リストにあるTaskTrackerの数を示します。 |
| グレイリスト入りTaskTracker | グレイリストにあるTaskTrackerの数を示します。 |
| ジョブ総数 | MapReduceで実行したジョブの総数です。 |
| スロット サマリ | |
| 総mapスロット | MapReduceでの総mapスロット容量を表します。 |
| 利用済みmapスロット | 利用中のmapスロットの数を示します。 |
| 総reduceスロット | MapReduceでの総reduceスロット容量を表します。 |
| 利用済みreduceスロット | 利用中のreduceスロットの数を示します。 |
| TaskTracker | |
| TaskTracker名 | タスクtrackerの名前です。 |
| ステータス | TaskTrackerの現在のステータスです。
|
| 正常性 | TaskTrackerの現在の正常性です。
|
| 失敗数 | TaskTrackerでの失敗の数を表します。 |
| キュー | |
| キュー名 | キューの名前です。 |
| ステータス | キューの現在のステータスです。 |
| 情報 | キューからのあらゆるエラー情報です。 |
|
ジョブ サマリ | |
|---|---|
| 送信済みジョブ | ステータス「submitted」のジョブの数を表します。 |
| 準備中ジョブ | ステータス「preparing」のジョブの数を表します。 |
| 実行中ジョブ | ステータス「running」のジョブの数を表します。 |
| 失敗ジョブ | ステータス「failed」のジョブの数を表します。 |
| 強制終了ジョブ | ステータス「killed」のジョブの数を表します。 |
| 完了ジョブ | ステータス「completed」のジョブの数を表します。 |
| 完了率(%) | 完了したジョブの比率を表します(%)。 |
| 強制終了率(%) | 強制終了したジョブの比率を表します(%)。 |
| 失敗率(%) | 失敗したジョブの比率を表します(%)。 |
| ジョブ統計(最新ポーリング間隔) | |
| 送信済みジョブ数 | ポーリング間隔に送信されたジョブの数を表します。 |
| 失敗ジョブ数 | ポーリング間隔に失敗ジョブの数を表します。 |
| 強制終了ジョブ数 | ポーリング間隔に強制終了されたジョブの数を表します。 |
| 完了ジョブ数 | ポーリング間隔に完了したジョブの数を表します。 |
Hadoop 2.x
| セーフ モード | |
|---|---|
|
セーフ モード ステータス |
セーフ モード ステータス ステータスには次のものがあります。 -Operational -Safemode |
| DFS | |
| 総DFS容量(GB) | HDFSの総容量です。 |
| 非DFS利用済みスペース(GB) | DFSコマンドを使わず利用されているHDFSメモリを指します。 |
| DFS利用済みスペース(GB) | DFSコマンドで利用されているHDFSメモリを指します。 |
| 利用中のDFSを指します(%)。 | HDFSメモリの利用率を示します(%)。 |
| DFS空きスペース(GB) | HDFSの空きメモリです。 |
| DFS空き(%) | HDFSの空きメモリ比率を表します(%)。 |
| ブロック | |
| ブロック容量 | Hadoopの総ブロック容量です。 |
| 総ブロック | Hadoopにあるブロックの総数です。 |
| 欠落ブロック | Hadoopに欠落ブロックがいくつあるかを表します。 |
| 破損ブロック | Hadoopに破損ブロックがいくつあるかを表します。 |
| 過剰ブロック | Hadoopに過剰ブロックがいくつあるかを表します。 |
| 複製不足のブロック | Hadoopに複製不足のブロックがいくつあるかを表します。 |
| 削除保留ブロック | Hadoopに削除保留ブロックがいくつあるかを表します。 |
| 複製保留ブロック | Hadoopに複製保留ブロックがいくつあるかを表します。 |
| ファイル | |
| 総ファイルとディレクトリ | HDFSにあるファイルとディレクトリの総数です。 |
| ファイル/ディレクトリ作成(/秒) | ファイルやディレクトリの作成速度を示します(数/秒)。 |
| 負荷 | |
| 総負荷 | Hadoopサービスへの総負荷を示します。 |
| DataNodeサマリ | |
|---|---|
| ライブDataNode | ステータス「live」のDataNodeの数を示します。 |
| デッドDataNode | ステータス「dead」のDataNodeの数を示します。 |
| ライブ廃棄済みDataNode | DataNodeのうち、ライブでありながら廃棄されている(decomissioned)ものの数を示します。 |
| デッド廃棄済みDataNode | DataNodeのうち、デッドであり、かつ、廃棄されている(decomissioned)ものの数を示します。 |
| 廃棄DataNode | ステータス「decomissioned」のDataNodeの数です。 |
| 古いDataNode | ステータス「stale」のDataNodeの数を示します。 |
| ライブDataNode率(%) | ステータス「live」のDataNode比率を表します(%)。 |
| デッドDataNode率(%) | ステータス「dead」のDataNode比率を表します(%)。 |
| DataNode | |
| ノード名 | DataNodeの名前です。 |
| ステータス | DataNodeの現在のステータスを表します。
|
| 総容量(GB) | HDFSの総容量です。 |
| 利用済み非DFS(GB) | 非HDFSコマンドで利用されたHDFSメモリの量を指します。 |
| 利用済みDFS(GB) | HDFSコマンドで利用されたHDFSメモリの量を指します。 |
| DFS利用率(%) | HDFSコマンドで利用されたHDFSメモリ比率を表します(%)。 |
| DFS空き(GB) | HDFSにある空きメモリの量を示します。 |
| DFS空き比率(GB) | HDFSにある空きメモリの比率を表します(%)。 |
| NodeMangerサマリ | |
|---|---|
| アクティブNodeManager | ステータス「active」のNodeManagerの数を示します。 |
| 廃棄済みNodeManager | ステータス「decommissioned」のNodeManagerの数を示します。 |
| 喪失NodeManager | ステータス「lost」のNodeManagerの数を示します。 |
| 異常NodeManager | ステータス「unhealthy」のNodeManagerの数を示します。 |
| リブート済みNodeManager | ステータス「rebooted」のNodeManagerの数を示します。 |
| アクティブNodeManager率(%) | ステータス「active」のNodeManagerの比率を表します(%)。 |
| 喪失NodeManager率(%) | ステータス「lost」のNodeManagerの比率を表します(%)。 |
| 異常NodeManager率(%) | ステータス「unhealthy」のNodeManagerの比率を表します(%)。 |
| NodeManager | |
| ホスト名 | NodeManagerのホスト名です。 |
| ラック | NodeManagerのあるラックを指します。 |
| ステータス |
NodeManagerの現在のステータスです。
|
| 利用済みメモリ(%) | NodeManagerが利用しているメイン メモリの比率を表します(%)。 |
| バージョン | NodeManagerのバージョンを指します。 |
| アプリケーション | |
|---|---|
| 送信済みアプリケーション | ステータス「submitted」のアプリケーションの数です。 |
| 完了アプリケーション | ステータス「completed」のアプリケーションの数です。 |
| 保留中アプリケーション | ステータス「pending」のアプリケーションの数です。 |
| 実行中アプリケーション | ステータス「running」のアプリケーションの数です。 |
| 失敗アプリケーション | ステータス「failed」のアプリケーションの数です。 |
| 強制終了アプリケーション | ステータス「killed」のアプリケーションの数です。 |
| 完了率(%) | 完了アプリケーションの比率を表します(%)。 |
| 強制終了率(%) | 強制終了アプリケーションの比率を表します(%)。 |
| 失敗率(%) | 失敗アプリケーションの比率を表します(%)。 |
| アプリケーション統計(最新ポーリング間隔) | |
| 送信済みアプリケーション数 | ポーリング間隔に送信されたアプリケーションの数を表します。 |
| 失敗アプリケーション数 | ポーリング間隔に失敗したアプリケーションの数を表します。 |
| 強制終了アプリケーション数 | ポーリング間隔に強制終了アプリケーションの数を表します。 |
| 完了アプリケーション数 | ポーリング間隔に完了したアプリケーションの数を表します。 |