8.3. 災害からの復旧

ちょっと実験的に考えてみてください。次回、データセンターへ行ったときに周りを見渡してみて、そこにあるものがなくなってしまった場合を想像してみます。コンピュータだけではなく建物全体がなくなってしまった場合を考えてください。次に、データセンター内で行なわれた作業をできる限り、何らかの形で、どこかで迅速に取り戻すことが任務であると想像してみます。何をしますか。

これについて考えることにより、災害からの復旧作業の第一歩をとることになります。災害からの復旧とは企業などのデータセンターの機能に影響を及ぼす事象からできる限り迅速にまた完全に復旧する能力です。災害の種類はさまざまですが、最終目的は常に同じです。

災害からの復旧に関連する手順は非常に多くまた幅広い分野に広がっています。ここではそのプロセスの高いレベルでの概要と、留意しておくべき重要点についてあげます。

8.3.1. 災害復旧プランの作成、テスト、実施

バックアップサイトは極めて重要ですが、災害復旧プランなしでは役立ちません。災害復旧プランとは災害復旧プロセスのすべての側面を指します。次のようなことが含まれますがこれに限られるわけではありません。

災害復旧プランはルーズリーフ式バインダ数冊に及ぶことがよくあります。緊急事態が発生した場合に、以前のデータセンターから残っているもの(最後のオフサイトバックアップ以外)としてオペレーションの立て直しと回復に役立つのはおそらくこのプランだけになるかもしれないため、このくらいのレベルでの詳細が非常に重要となります。

ヒントヒント
 

災害復旧プランは職場内で容易に手の届く場所に置いておく必要があり、職場以外の場所にもコピーが保管されていなければなりません。こうしておくと、災害によって被害が発生しても災害復旧プランのいずれかのコピーが残ります。オフサイトのバックアップストレージがある場所がコピーの保管場所には最適です。企業のセキュリティポリシーに違反しないならすぐに使えるよう主要チームメンバーの自宅にコピーを保管するのもよいかもしれません。

このような重要書類は当然、真剣に考慮される必要があります(また、作成には専門家による助力が必要な場合もある)。

こうした重要書類が作成されたら、記載されている知識を定期的にテストする必要があります。災害復旧プランをテストすると言うことは、プランの手順を実際に行なってみるということです。バックアップサイトへ行って臨時のデータセンターを設置し、アプリケーションを遠隔で実行、"災害"が納まったら通常オペレーションを回復します。ほとんどのテストはプランにある作業を 100% 行なうわけではなく、代表システムとアプリケーションを選んでバックアップサイトに移動します。一定期間実稼働に入れてからテスト終了後に通常オペレーションに戻します。

注記注記
 

何度も繰り返しますが、災害復旧プランは現実に即していなければなりません。データセンターに変化が生じたら、プランはその変化を反映するように更新されなければなりません。多くの点で、現実に即していない災害復旧プランはまったくプランがない状態よりさらに悪化することもあるため、プランの定期的な(例えば、4 半期毎)再検討と更新を行なう機会を設けてください。

8.3.2. バックアップサイト — コールド、ウォーム、ホット

災害からの復旧で最も重要となる側面のひとつが復旧作業を行なうための場所を確保することです。この場所はバックアップサイトと呼ばれています。災害発生時には、バックアップサイトにデータセンターが再構築され、災害が納まるまでここからオペレーションを行ないます。

バックアップサイトには 3 種類あります。

これらはもちろんバックアップサイトの気温のことを指しているわけではありません。災害発生時にバックアップサイトでオペレーションを開始するために必要となる労力を指しています。

コールドバックアップサイトは建物内に設けたスペース程度のことになります。ユーザーにサービスを復元するのに要するすべてのものは復旧プロセスが開始される前に入手してこのサイトに送られる必要があります。おわかりのように、コールドバックアップサイトからの全操業の遅延は重大となり得ます。

コールドバックアップサイトは最も低コストで実現できるサイトになります。

ウォームバックアップサイトには常に、データセンターにあるファックスなどに相当するような適度なハードウェアが備えてあります。サービスを復元するためには、オフサイトストレージからの最終バックアップが送られベアメタルの復元を完了する必要があります。それから実質作業の復元を開始することができます。

ホットバックアップサイトには現在のデータセンターの各種ミラーイメージがあり、すべてのシステムが設定済みでオフサイトストレージからのユーザーデータの最終バックアップを待っているだけの状態です。おわかりのとおり、ホットバックアップサイトでは多くの場合、数時間以内に完全な実稼働環境を取り戻すことができます。

ホットバックアップサイトは災害復旧対策として最もコスト高になるサイトです。

バックアップサイトの供給源は 3 通りあります。

それぞれに長所と短所があります。例えば、災害復旧サービス提供企業との契約は多くの場合、災害復旧プランの作成、テスト、実施に伴うプロセス全体に渡り技術を有する専門家から指導を受けることができます。ご存知の通り、こうしたサービスにはそれなりの経費がかかります。

企業が所有し自社運営する場所のスペースを使用するとまずコストがまったくかかりませんが、バックアップサイトを設置していつでも対応できるよう維持するにはやはり経費が必要になります。

別の企業とのデータセンター共用に関する契約を結ぶことはコスト的にはかなり効果がありますが、こうした条件での長期的なオペレーションは通常は無理があります。ホストのデータセンターは通常の実稼働環境も維持する必要があるため、過大な負担がかかってしまうからです。

最終的には、バックアップサイトの選択は経費と実稼働環境の継続性に関する企業のニーズが折り合うところになります。

8.3.3. 使用できるハードウェアとソフトウェア

災害復旧プランにはバックアップサイトでのオペレーションに必要となるハードウェアとソフトウェアの入手方法について記述されていなければなりません。専門的に管理されているバックアップサイトにはすでに必要なものはすべて揃っているかもしれません(または、サイトにはない特殊資材の入手と配送を手配する必要があるかもしれません)。一方、コールドバックアップサイトの場合には、すべてのアイテムに対して信頼性のある供給源を確認しなければなりません。多くの場合、企業はメーカと災害発生時におけるハードウェアまたはソフトウェアの迅速な配送に関する契約を結んでいます。

8.3.4. 利用できるバックアップ

災害が公表されたら、2 つの理由でオフサイトストレージ場所に通知する必要があります。

ヒントヒント
 

災害が発生した場合、旧データセンターからの最終バックアップは非常に重要になります。あらゆる行動を起こす前に、コピーを作成することを考えます。オリジナルのバックアップはできるだけ早くオフサイトに戻します。

8.3.5. バックアップサイトへのネットワーク接続

対応しようとしている本社から完全に接続が断たれている場合、データセンターはあまり役に立ちません。災害復旧プランや災害の性質によりますが、ユーザーの人達がバックアップサイトからかなり離れた場所にいるかもしれません。こうした場合、確実な接続が実稼働への復旧に非常に重要となります。

別の種類の接続として留意したいのは電話線です。ユーザーとの口頭によるコミュニケーションをすべて処理するのに十分な電話線が確保されていることを確認します。仕切り越しに声をかければ通じていたことが長距離電話による会話になるため、一見して明らかな必要性以上に電話接続については十分な計画を立ててください。

8.3.6. バックアップサイトの人材

バックアップサイトの人材配置に関する問題は複数次元になります。必要とされる期間中に渡りバックアップデータセンターの運営に必要な人材の配置を判断することがそのひとつです。災害が発生している異常事態下でオペレーションを続行するための労力を維持する人材がより多く必要となる一方、短期間なら最小限の人材で維持できるかもしれません。

人材に対して十分な休憩と帰宅するための十分な時間が与えられているかを確認することも含まれます。災害の被害が広範囲に渡り社員の自宅や家族にも影響を及ぼす状態なら、各個人が自身の復旧をする余裕を与える必要があります。バックアップサイト付近に臨時の宿泊施設を用意することが必要な他にも、バックアップサイトと宿泊先間の移動手段を確保することも必要になります。

災害復旧プランの中には社内のユーザーを代表するオンサイトスタッフが含まれている場合がよくあります。遠隔のデータセンターで運営していくその企業によって異なります。ユーザー代表がバックアップサイトで作業を要される場合、同様に宿泊施設を用意する必要があります。

8.3.7. 正常なオペレーションへの移行

最終的にはいずれの災害も終りを迎えます。災害復旧プランの中にはこの段階の対応も含まれていなければなりません。新しいデータセンターは必要なハードウェア及びソフトウェアをすべて装備している必要があります。この段階では災害が最初に公表されたときに行なわれる準備のような時間的切迫感はあまりありませんが、バックアップサイトの経費は運営している期間中継続的にかかるため切替えはできるだけ迅速に行なわれることになります。

バックアップサイトからの最終バックアップを作成して新しいデータセンターへ送ります。新しいハードウェアでバックアップを復元したら、実稼働環境を新しいデータセンターへ切替えることができるようになります。

これでバックアップセンターを廃止にすることができるようになり、プランの最終段階で示されている臨時のハードウェアすべてを処分します。最後に、プランが有効であるかの検討を行ない、検討委員会などで指摘された変更をプランの更新に統合します。