Select Language : English 日本語

NTTコミュニケーションズ

法人のお客さま: English / 日本語
個人のお客さま: English / 日本語

NTT Ltd.

グローバルサイト English
中国本土: English / 日本語 / 簡體中文
フィリピン(DTSI): English

お客さまの課題解決のヒントをお届けするデジタルマガジンICT Business Online

メルマガ登録

頼りのクラウドサービスが大規模故障!?明暗を分けるクラウド運用テクニック

印刷

AWSの大規模故障で影響を最小限に抑えた対策とは

昨年、8月に起きたパブリッククラウドサービス「AWS」(Amazon Web Services)の大規模故障は、国内のさまざまなサービスに大きな影響を及ぼしました。大手ECサイト、モバイル決済サービス、モバイルゲームなどが軒並み利用できない、利用しづらい状況に陥ったのです。これを受けて「クラウドサービスの脆弱性が露呈」「オンプレミスへの回帰」といった過激な論調も見受けられましたが、障害の起きた部分が一部の仮想マシンだったこと、約6時間で完全復旧したことを考えると依然としてクラウドサービスの優位性が揺らぐことはありません。もしも同様の障害がオンプレミスで発生したことを想定すると、おそらく復旧までにさらに多くの時間を要したと考えられるためです。

この大規模故障に見舞われつつも影響を受けなかった企業もあります。冗長化、コンテナ化、サーバレス化など対策はさまざまですが、いずれも「AWSが故障する可能性」を想定した対策をしっかり講じていたことが功を奏しました。つまり、故障に強い、あるいは故障が起きても迅速に復旧できるシステム設計になっていれば、今回のような不測の事態も安心して乗り切れるのです。たとえ1つのクラウドサービス内でデータセンターが冗長化されていても故障が起こる可能性はゼロではありません。いまこそ、クラウド運用の在り方を考え直す時期を迎えているのかもしれません。

ダウンのリスクはクラウドだけとは限らない

ネットワーク接続が前提となるクラウドサービスを安定して利用するためには、最適なネットワーク、通信機器などの選定、運用も重要なポイントになります。ネットワークの遅延、通信機器の故障などを起因としてクラウドサービスが利用できない状況が生じてしまうためです。複数のサービスを組み合わせたマルチクラウド環境の構築は安定性を高める有効な一手ですが、その際にどのようなネットワークを選定し、どのように接続するかを考える必要があります。

たとえば、インターネットとVPNなどの閉域接続をどのように使い分けるべきか。絶対に落とせないリソース、そうでもないリソースを見極め、いかにクラウド上に振り分けていくか。さらにOffice 365を社内で利用するのであれば、社内WANのボトルネックを回避する方法も必要になるでしょう。あるいはスマートフォンなどを利用した社外接続による利用もあれば、その状況も想定した対策を講じる必要があります。ひとことにクラウドを活用するといってもクラウド側、ネットワーク側の双方から、安定運用に向けて検討すべき項目は多岐にわたります。

図:ダウンのリスクはクラウドだけとは限らない

しかし、ここにはグレーゾーンが存在します。クラウドサービスを提供するクラウド事業者、そしてネットワークを提供する通信事業者、窓口が2つ存在する場合には故障時の切り分け、原因特定に時間がかかってしまうことがあります。クラウド事業者はネットワークのプロではありません。逆もまた然りです。ときには両者から「うちのサービスには問題が見つかりません」と回答される最悪のケースも考えられます。クラウドだけではなく、ネットワークだけでもない。これからはIT基盤全体を俯瞰したクラウド運用を考える必要があります。そのためにはクラウド、ネットワークの双方に対してのノウハウ、知見を持ったパートナー選びが重要になってくるのです。

関連サービス