SLAとは?
SLA(Service Level Agreement)とは、ITシステムを提供する際の、ITサービスの品質、可用性、責任などに関する取り決めのことです。また、取り決め内容を明示した同意書をSLAと呼ぶこともあります。
システム運用においては、以下のような項目がSLAによって定められます。
- サーバーの可用性:○○.○%以上
- 重大障害の発生件数:○回以内
- 障害復旧時間(MTTR):○○時間以内
- 平均故障間隔(MTBF):○○時間以上
システムのSLAを管理する必要性
SLAを取り交わす主な目的は、サービス提供者と利用者の間でサービス水準の合意をとり、契約後のトラブルを回避することです。サービス提供者がSLAを遵守することで、不要な問題を避け円滑にシステムを運用することができます。
それでは、サービス提供者がSLAを達成できなかった場合はどうなるのでしょうか。
一般的に、SLAには規定された内容を達成できなかった場合のペナルティー規定も含まれます。ペナルティーの内容によっては支払い料金の減額や、損害賠償金の請求などもありえます。そのうえ事業者としての信用も失ってしまいますので、利用者がサービスの利用を中止したり、契約更新しないという事態も十分考えられます。
システム管理者は常にSLAを意識し、安定稼働させる義務を負っていると言えるでしょう。
SLA管理のよくある課題3点
サービスレベルを管理するうえで、よく聞く課題には以下の3点があります。
複数のSLAがあると管理が複雑になる
複数のSLAを一元管理するのはサービス提供者にとって容易ではありません。
同じシステムでも、複数の利用者がいると違うSLAを定める場合があります。また、システムの契約更新時にSLAもあわせて更新されることもあります。
複数のSLAがある場合には、管理するための仕組みも検討しなければなりません。
SLA違反の監視が負担になる
SLAに違反した場合は即座の把握と、迅速な対応が求められます。ただ、多くのシステムを運用している場合、それだけSLA違反に気づくことも難しくなります。
多数のシステムやSLAがあっても、違反時にすぐに検知できる仕組みが必要と言えるでしょう。
サービス提供側の情報共有が困難
担当者間での情報共有についても考えなければいけません。
システム運用の現場では、ネットワーク担当、サーバー担当、アプリケーション担当というように分業化されていることが珍しくありません。
専門領域を効率的に管理できるメリットがある一方、部門間での情報共有が難しくなる場合が多く、SLA管理についても例外ではありません。
たとえばSLAに違反してしまったとき、システムの全体を把握できている人がおらず、原因特定に時間がかかってしまうという恐れがあります。
SLA管理についても、担当の間で簡単に共有できる仕組みがあるのが理想です。
自動でSLA管理ができるシステム監視ツール
ManageEngineはシステムSLAの管理が簡単にできるシステム監視ツールApplications Managerを提供しています。
システム管理を効率化し、デー タベース・アプリケーション・Webサーバーなどを簡単に一元監視す ると同時に、重要な SLA項目である可用性や、障害 発生件数、MTTR(平均復旧時間)やMTBF(平均障害間隔)などを自動で計測し、専用の SLAダッシュボードにわかりやすく表示します。また、PDFやCSV形式のレポートを出力することも可能です。
Applications ManagerのSLA管理ダッシュボード
監視と連動したSLAレポートによって、容易に運用状況を可視化しシステムの安定運用をサポートします。
SLA管理について、さらに詳細を知りたい方には以下のホワイトペーパーがオススメです。無料で公開しておりますので、ぜひお気軽にご覧ください。
インストール不要な体験サイト
ManageEngineのアプリケーション性能監視ツール「Applications Manager」では、ツールの使用感を確認できるGUIベースのサイトを提供しております。制限はありますが、実際に操作いただくことも可能です。
インストールや設定は一切必要ないので、お気軽にお試しください。