インフィニティソリューションズ株式会社ブログ

Amazonの障害がNetflex、Heroku、Pinterest、Instagramに影響。米政府の動きにも影響を与えるか。

日本のファーストサーバの大規模障害が発生してほどなく、今度は激しい雷雨によりAmazonに電源障害が発生し、Amazonを使っている事業者のサービスに影響が発生した。これを受けて米政府のクラウドへ移行する動きにも影響が出るかもしれない。InformationWeekおよびThe Washington Postより。

まず、Netflex、Heroku、Pinterest、Instagramでは何が起こったか。InformationWeekの「Amazon Outage Hits Netflix, Heroku, Pinterest, Instagram」によれば、

‘Severe thunderstorms rolled through northern Virginia Friday evening and Amazon Web Services U.S. East data center, its largest, lost power at 8:40 p.m. The power was restored about nine minutes later but Netflix, Instagram, Pinterest, Heroku and other companies that depend on its infrastructure were affected.’

Thunderstorm

「金曜の夜、北部バージニアに発生した激しい雷雨の影響で、Amazon Web Service最大のU.S. Eastデータセンターで、午後8時40分に停電が発生。電源は9分後に回復したものの、Netflex、Heroku、Pinterest、Instagramなど、Amazon Web Serviceにインフラを依存している企業が影響を受けた。」

‘”We’re currently experiencing technical difficulties and we’re working to correct the issues. Thanks for your patience,” said Instagram via Twitter at 8:16 p.m. Pacific Friday.’

「太平洋時間金曜日午後8時16分、InstagramはTwitterで以下のようにツィートしている。『現在技術的障害が発生しており、修復作業中』」

‘Heroku told its users two minutes later: “Our automated systems have detected potential platform errors. We are investigating.”’

「Herokuはその2分後、『自動システムが潜在的なプラットフォーム上のエラーを検知し、現在調査中。」

‘Cedexis, the cloud monitoring service, said service was impacted by the power outage beginning at 8 p.m. Pacific (or 3 a.m. Saturday Greenwich Mean Time). It affected Amazon’s availability zone 1B of its Elastic Compute Cloud service. 1B is one of what are believed to be four zones in Amazon’s U.S. East-1 data center (Amazon doesn’t state how many zones are in each facility) and zone 1B compute service was completely down an hour later, said a Cedexis spokesman.’

「クラウドモニタリング・サービスのCedexisによれば、太平洋時間の午後8時から始まった停電よりサービスが影響を受けた。影響を受けたのは、Elastic Compute CloudサービスのAvailability Zoneのうちの1B。1BはAmazon U.S. East-1データセンターの4つある(と考えている)ゾーンの1つ(Amazonは各設備にいくつのゾーンが含まれているかを明らかにしていない)。Cedexisの広報によれば、ゾーン1Bのcomputeサービスは1時間後完全にダウンした。」

‘Basic EC2 service was out in the one zone for about two hours, according to Cedexis, although individual virtual server instances and some Elastic Block Store volumes were out for a longer period.’

「Cedexisによれば、このゾーンのベーシックなEC2サービスは約2時間にわたってダウンしていたが、個別の仮想サーバ・インスタンスやいくつかのElastic Block Storeボリュームではもっと長い時間ダウンしていた。」

At 8:40 p.m. Amazon’s dashboard acknowledged to customers that “a single Availability Zone has lost power due to electrical storms in the area. We are actively working to restore power.” At 9:01 p.m. Pacific, Amazon acknowledged that the loss of an availability zone in U.S. East–1 had affected its Elastic MapReduce service as well.

「午後8時40分、Amazonのダッシュボード上でユーザに以下のように伝えている。『1つのAvailability Zoneにおいて、当該地域で発生した雷雨により停電が発生。現在鋭意電源回復作業中』。午後9時1分、Amazonは、U.S. East-1のAvailability Zoneでの障害により、Elastic MapReduceサービスにも影響が出ていると通知。」

‘Netflix relies primarily on Amazon infrastructure for its film delivery service. At 10:15 p.m. Friday, Netflix tweeted: “We’re sorry for the outage and working to get your Friday streaming back to normal as quickly as possible. Thank you for bearing with us.” Netflix uses more than one availability zone, and has recovery plans in case of the loss of an availability zone. Nevertheless, the power outage affected some customers.’

「Netflixはビデオ配信サービスに主としてAmazonのインフラに依存している。金曜日午後10時15分、Netflixは以下のようにツィートしている。『障害が発生し申し訳ない。金曜日のストリーミングをできるだけ早く正常に戻すよう作業中』。Netflexは1つ以上のAvailability Zoneを使用しており、Availability Zoneの消失時のリカバリプランも持ち合わせている。にもかかわらず顧客の何人かは影響を受けた。」

‘At 1:11 a.m. Pacific time Saturday, Netflix was able to tweet: “Everyone should be back up shortly, if you aren’t already. Thanks again for being patient. And awesome.”’

「太平洋時間土曜日午前1時11分、Netflexはこのようにツィートした。『まだ障害になっている方も、まもなく全員復活する。お待ちいただきありがとうございます。』

‘Heroku posted the notice at 9:33 p.m. Pacific that its engineers had moved customers out of the AWS infrastructure onto new servers. At 10:35 p.m. Pacific, its status page posted the following update: “We’ve restored the majority of internal services and are seeing a reduction in error rates, but many applications and databases remain offline. We are continuing to work to restore processes and databases.”’

「Herokuは午後9時33分に、エンジニアが顧客をAWSインフラから新サーバに移行したとポスト。午後10時35分、ステータスページで以下のように状況を更新している。『主要な内部サービスはリストア済み。エラー率も低下してきているが、アプリケーションやデータベースの多くはまだオフラインのまま。プロセスとデータベースのリストア作業を継続中。』」

Amazon’s dashboard warned that Elastic Block Store storage service had also been affected by the outage. While it continued running, affected EC2 customers who may have thought their instances were writing to storage would find later that wasn’t the case, or that data updated in one EBS volume might not have been updated in another.

「Amazonのダッシュボード上では、Elastic Block Storeストレージサービスもこの障害により影響を受けたと警告している。継続稼動したものの、影響を受けたEC2のユーザでは、インスタンスからストレージに書き込み済みの想定のものが、書き込み済みではない、EBSボリュームの1つで更新したデータが他で更新されていないといった事態が発生した。」

— 6月半ばの電源障害と同様、今回もバックアップ電源がうまく動作しなかったように思える。バックアップが正常に作動していれば、9分間の停電など問題ではないのではないか。雷雨を原因とする天災ではなく、人災のように思えてならない。

‘The House subcommittee on commerce, manufacturing and trade is studying the risks of such moves and hopes to schedule a hearing on the matter ahead of the August congressional recess.’

「米国下院商業製造貿易小委員会は(州政府がメールやその他のサービスをクラウドに移行しようという)動きに関するリスクを調査中であり、8月の休会前のヒアリング開催を希望している。」

“Last week’s powerful thunderstorms, along with the massive disruptions they caused, exposed some of the vulnerabilities of cloud computing,” said the panel’s chairman, Rep. Mary Bono Mack (R-Calif.), in a statement. “But I also believe the problems extend way beyond consumer convenience and customer service. There are some serious privacy issues which we need to look at as well.”

「『先週の激しい雷雨とそれに伴う大規模な障害により、クラウドコンピューティングの脆弱性が明らかになった』と小委員会の議長、mar Bono Mack議員は声明を発表している。『また、問題は消費者の利便性やカスタマーサービスにとどまらない。良く検討しなければならない深刻なプライバシー問題も存在している。』」

— 何かあると、直接関係がない事柄まで引っ張りだされるのは世の常。抜本的な対応をとってもらいたい。