こんにちは。オレンジ色のユニフォームです。
以前、ITIL関連のセミナーに参加したときに「これは良いこと聞いた」と思った話がありました。
講師の方の会社では、システム障害が起きると障害対策チームが作られ、障害対応にあたるそうです。
ここまでは良くある話です。
障害が発生した時は、ホワイトボードに障害の事象や対応状況を時系列に書き込んでいくそうです。関係者間で情報を共有化するためです。
ここまでも良くある話です。
「これは良いこと聞いた」と思ったのは、ホワイトボードに記録する人に特徴があったのです。
多くの会社では、そのシステムのことを良く知っている人がホワイトボードに書き込んでいるではないでしょうか。
このやり方だと、本来、障害の原因調査や回復対応にあたるべき人の手を奪ってしまうことになります。
また、集まってきた外野、とくに上役は、「どうなっているんだ」「どうするんだ」「いつまでかかるんだ」とその人に質問しちゃうものです。それがまた障害からの回復を遅らせることになります。
講師の会社では、障害が起きると、ホワイトボードの前に従軍記者が現れるそうです。
この従軍記者は指示を受けた人が受け持ち、起きている事象、判明した事実、実施したこと、そしてその結果を、時々刻々と記録していくそうです。
障害回復のキーマンの手は楽になり、障害対応に時間が割けるようになります。同時に関係者間で情報の共有化もできます。
それに加え副次効果としてて、従軍記者の役をやった人は、障害対応の現場で貴重な経験を積むことになるのではないでしょうか。
障害というなかなか起きない緊迫した現場に立ち会えることで、
決して教科書からは学ぶことができない多くのことを習得できるのです。
システムの運用を行っているところではシステム障害はつきものです。
システム障害は起こしたくて起こしている人はいません。
システム障害を起こさないことも大事ですが、起きてしまったときに、どのように行動するかをきちんと準備している組織は強い組織だと思います。
「良いことを聞いた」だけではなく、行動につなげるよ >オレユニ
合点承知の助!