Googleは、2019年6月2日に発生した大規模障害についての原因を明らかにしました。
「Google Cloud」で障害が発生し「YouTube」「Gmail」「Google検索」「G Suite」「Google Drive」「Google Docs」など、関連したウェブサービスが利用できなくなりました。
出典:centさま
https://japan.cnet.com/article/35138018/
世界規模でアクセス障害が発生し各サービスでエラーや情報更新ができない事象が発生しました。
障害が発生したのは現地時間の6月2日12時25分(日本時間の日本時間で6月3日4時25分)。 障害は同日16時45分(日本時間の日本時間で6月3日8時45分)に終了しました。
幸いにも、日本ではそれほど大きな影響を与える時間帯ではなかったものの、世界中の広範囲で被害発生報告がされていました。
Googleは「Google Compute Engineに関する問題」と記述し大きなネットワーク問題だと発表した。
大規模障害は、小規模なサーバーの設定変更を誤って隣接する複数のリージョンの多数のサーバーにも適用してしまったことが根本的な原因だったようです。これらのリージョンのネットワーク帯域の半分以上を埋めてしまった事にある。とブログで公表しています。
間違ったサーバ設定が拡散された結果、ネットワークが輻輳を起こしてしまいそれが根本的な障害の原因に。
YouTubeや、Gmailが一時的にアクセスできない状況になり、発生報告件数は広帯域を必要とするYouTubeが圧倒的に多くロードが終わらない、エラーメッセージが出るなどの被害が寄せられました。
Gmailは問題が発生したのはほんの1%としているが、ユーザーの割合としては小さく感じるが数百万人が送受信できずにいたことになります。
また、AppleのiCloudも障害の影響を受けていた。
(AppleはiCloudがGoogle Cloudを使用している)
障害の原因となったネットワークの輻輳が、その後の復旧作業を難しくさせました。Googleのエンジニアは問題発生後数秒で検知したものの問題の修正には4時間以上もの時間を要しています。
問題修正に時間がかかったしまった原因として、ネットワークが集中し混雑してしまったことにより復旧するエンジニアの操作が妨げられたと説明しています。
サービス低下をもたらしているこのネットワークの輻輳自体が、エンジニアが正常な設定を行うための復旧作業そのものを長引かせました。
Googleは一部原因を発表し、障害は復旧しましたがユーザーにはパフォーマンスの低下や断続的なエラーが発生する可能性がありますとアナウンスし大規模障害、復旧の遅れの原因を明らかにすべく現在も調査を進めています。
Googleは世界のインターネットで最も利用され信頼されているだけにこのような障害が起きたときは多大な影響を及ぼしてしまいます。
サービス停止になってしまったアプリを見ても多くのサービスがGoogleに依存していることが分かります。
どんなことであれ、トラブルは承知の上で行動しなければなりません。
Googleに依存しすぎているだけにわずかな時間でも利用できなくなると混乱が生じてしまう危険性を利用する我々も日頃から認識しておかなければならないでしょう。