インシデント管理とは? インシデント管理が必要な理由と効率化の方法
インシデント管理とは、インシデント(事故や事故が発生する恐れがある状態など)を発生の把握から収束までとフェーズに分けて管理することで、同じインシデントを繰り返し発生させないようにし、運用をスムーズにする取り組みのことをいいます。
インシデント管理は、安全管理や保安業務でよく行われます。医療現場やITシステム運用などでよく聞かれ、ITサービスマネジメント(ITSM)においても重要です。
本記事では、インシデント管理の必要性やよくある課題などについて紹介します。
インシデント管理とは
インシデント管理は、英語では「Incident Management」といい、インシデントの発生から復旧までを管理することをいいます。
インシデント管理についての詳細の前に、まずは「インシデント」について説明します。
インシデントとは
インシデントとは、英語では「Incident」といい、「できごと」「事件」「異変」などと訳されます。
意味としては、事故そのもの、または事故が発生する恐れがある状態などを指し、安全管理や保安業務でよく使われます。医療現場やITシステム運用などでよく聞かれますが、ここでは後者の場面におけるインシデントを対象として解説します。
ITシステム運用におけるインシデントの例
ITシステム運用に限ってもインシデントが指す範囲は幅広く、例えば、以下のようなものがインシデントに当たります。
- 顧客から、利用しているITシステムにアクセスできないと問い合わせが入る
- 悪意あるメールに記載されたURLを従業員がクリックしてしまい、不正なWebサイトへアクセスしてしまった
- 社内システムの画面が固まってしまい、次の画面に遷移しない
- アプリケーションを使用しようとしたら「ライセンスが切れている」とエラーが出る
インシデントと障害との違い
ITシステム運用の中でも、現場や管理目的によって「インシデント」が指す内容は異なりますが、厳密にいえば「インシデント」と「障害」はイコールではなく、「障害は、インシデントを引き起こしている要因の一つ」となります。
インシデントを引き起こす要因は「問題」とも呼ばれ、この「問題」を管理することが、同じインシデントを繰り返さないために重要です。
詳しくは後述の「インシデント管理のよくある課題」でお伝えします。
インシデント管理とは
インシデント管理とは、こうしたインシデントの発生把握から収束、つまり元の状態に復旧するまでを管理することです。
たとえば、自社が何らかのITシステムを提供している場合は、顧客から不具合の連絡を受けてから対応が完了して顧客が問題なくシステムを利用できるまで、さらには再発防止策までがインシデント管理の範囲となります。
一般的なインシデント管理の流れについては、次項でご紹介します。
一般的なインシデント管理のフロー
インシデント管理は一般的に次のフローで実施されます。
1.インシデントの検出・受付
インシデントが発生すると、ユーザーからの問い合わせやアラートによってインシデントの発生が確認されます。
このインシデント内容をツールなどに入力して受け付けます。
2.インシデントの分類・優先度の設定・担当者の割り振り
インシデント内容をもとにインシデントを分類します。分類方法は、現場によってさまざまですが、たとえば、緊急度・重要度・関連するIT資産・ユーザーなどによって分類します。
分類後、業務などへの影響度の大きさにより優先度を設定します。
さらに、担当者を割り振ります。
3.一時対応による解決
対応手順が決まっているような対応が容易なインシデント、過去に発生したことのある既知のインシデントなどについては、担当者がそのまま対応します。
4.エスカレーションによる解決
一時対応では解決が難しい内容のインシデントは、より詳細な調査や正確な診断が行える専門性を持つ担当者やマネージャーなど責任者へエスカレーションして対応に当たります。
5.インシデントのクローズ
問題が解決してシステムなどが復旧したら、顧客への報告や、その経緯をツールなどへ記録し、インシデント対応を終了します。
インシデント管理の必要性
インシデントについては、一度起きたインシデントと同様のインシデントを起こさないことと、起きてしまったインシデントを素早く解決し、復旧させることの2点が重要です。
これらを実現するためには、インシデント管理を行う必要があります。
同じインシデントの再発防止のため
インシデントをゼロにすることはほぼ不可能といえ、ある意味では、インシデントが起きてしまうことは仕方のないことです。
しかし、インシデントにはそれを引き起こす問題(「要因」とも呼ばれる)があり、解消できる要因を取り除くことで、同じインシデントの繰り返しを回避できる可能性は高まります。
先ほどもお伝えしましたが、この「問題」を管理することが、同じインシデントを繰り返さないためには重要になってきます。
問題管理について詳しくは「インシデント管理のよくある課題」でお伝えします。
問題管理のためにも、また、過去に起きたインシデントを把握するためにも、起きたインシデントを一件ずつ確実に記録に残し、管理することが大切になります。
スムーズなシステム運用・ITサービス提供のため
前項でお伝えしたように、問題管理を行うことで同じインシデントを繰り返し発生させないことが重要ですが、除去できる問題ばかりとは限らず、同様のインシデントが何度も発生してしまう状況もあり得ます。
そんなケースでも、正しくインシデント管理を行っていれば、過去の対応履歴を参照して対応できるため、効率や対応スピードを向上させることができます。
同じインシデントに限らず、すべてのインシデントを記録・管理しておくことで、対応した担当者や復旧までにかかった時間などの履歴が、新たなインシデント対応や体制づくりなどに役立ちます。
それが、ひいてはスムーズなシステム運用・ITサービス提供につながります。
インシデント管理のよくある課題
インシデント管理を行う中で起こりがちな課題は、主に以下の3点です。
同じインシデントを繰り返してしまう
ここまでにも何度か出てきましたが、同じインシデントの繰り返しを回避することがインシデント管理の大きな目的の一つです。
その場しのぎの対応でインシデント対応を完了させてしまい、解決まで導くため過程の蓄積を怠ったり、根本原因を解決しなかったりということが課題として挙げられます。
「インシデント管理」と「問題管理」の違いを理解できていない
インシデント管理の目的は暫定対応、問題管理の目的は根本原因の特定です。つまり、インシデント管理には対応スピードが求められ、問題管理には問題を解決に導いた件数が指標となります。
この2つを混同して考えているケースは非常に多くあります。根本原因を調べるのに時間を掛けすぎて、ユーザーがサービスを使えない状況が長く続いたり、逆に、暫定対応ばかりしているので、同じインシデントが繰り返されたりするケースは良くあります。
インシデントは絶対に「0」にはなりません。インシデントが発生したときにはまずサービス復旧を最優先し、インシデントが発生していないときには、過去に発生したインシデントの分析・調査をすることで、インシデントの発生数を減らしていくことが大切です。
インシデントの情報共有ができていない
課題の一つ目「同じインシデントを繰り返してしまう」とも関連しますが、現在進行中のインシデント対応については、担当者や進捗状況(ステータス)などがわからない状態のままインシデント対応を続ければ、行き違いや手戻りが発生する恐れが高く、非効率的です。
また、過去のインシデント対応について履歴が残っていないと、過去に同様のインシデントが発生・対応しているのに、また一から調査を行ってしまうなど二度手間になり、余計な工数がかかります。
これは、言い換えると「チーム内でナレッジが共有されていない状態」ともいえ、対応の属人化にもつながりかねません。
インシデント管理ツールを使うメリット
発生したインシデントの対応記録と可視化、情報共有に特化しているのがインシデント管理ツールです。
インシデント管理ツールを使うと、主に以下の4つのメリットが得られます。
インシデントの現状を可視化できる
インシデント管理をツール上で行えば、グラフなどによる可視化が簡単に行えます。
また、インシデント管理ツールに入力した内容は、閲覧権限のあるメンバーであればいつでも確認でき、情報共有もスムーズです。社内で起きるインシデントへの対応については、対応部門だけでなく利用部門にも閲覧権限を付与することで、報告業務の負荷が軽減されるでしょう。
インシデントの管理フローを標準化できる
インシデント管理ツールに設定したステータスを順に追って対応することで、フローのヌケやモレがなくなり、対応担当者によるバラツキを解消できる効果が期待できます。
また、管理フロー見直しの場面でも、インシデント管理ツールに蓄積されたデータを分析することで、より効果的な改善が期待できます。
インシデント対応のナレッジを共有できる
毎回、インシデント対応の記録をツールに入力していくことで、インシデント対応のデータベースができます。
対応メンバーは、過去のインシデント対応履歴を参照できるため、対応したことがないインシデントについても対応フローを疑似体験でき、インシデント対応の参考にできます。
対応のスピードアップにつながる
上記3点から、インシデント対応の効率化が実現でき、対応のスピードアップにつながります。
まとめ:インシデント管理の課題解決には管理ツールの導入が有効
インシデント管理とは、インシデント(事故や事故が発生する恐れがある状態など)を、発生把握から収束までのフェーズを管理することで、同じインシデントを繰り返し発生させないようにし、運用をスムーズにする取り組みのことをいいます。
ご紹介したようなインシデント管理の課題をお抱えの企業様は、解決のために、業務効率化のために、管理ツールの導入を検討してみてはいかがでしょうか。
ヘルプデスクの問題点や解決策、構築ステップをご紹介する資料はいかがですか?
ヘルプデスクの問題点から、解決策としてのサービスデスクをいかに構築するか、そのステップをご紹介します。ヘルプデスクの事例集もあわせてダウンロードいただけます。
- 【ノウハウ資料】「サービスデスク・ヘルプデスクのシステム導入時に比較するべき3つのポイント」
- 【ノウハウ資料】「組織を改善する“サービス”デスクを構築するための3ステップ」
- 【事例集】ヘルプデスク実践事例集
- 【製品紹介】「解説!LMIS」