
- 1 : 2025/06/16(月) 21:51:28.99 ID:YOzPo3Jy
-
2025 Jun 16 12:31
新野淳一
Google Cloudは日本時間で6月13日金曜日の午前2時49分から約3時間のあいだ、Google Cloudの世界中のリージョンにおいてAPIへのアクセスに対して503エラーの発生が増加するなどの障害を起こしていました。
この影響でSpotifyやTwitch、NPM、Firebaseなど、Google Cloudを利用していた多くのサービスにも障害が発生することとなりました。
この障害の原因についてGoogle Cloudは6月15日に詳しい報告を公開しています。
報告によると、Google Cloud APIを外部に提供するために世界中の各リージョンに配置されているGoogle API管理ツールに追加した新機能に潜在的なバグがあり、適切なエラーハンドリングやフィーチャーフラグが働かない状態でヌルポインタを参照しクラッシュ。
世界中の各リージョンでほぼ同時にこのクラッシュが発生したことが障害の原因だとしています。
時系列で何が起きたかをまとめました。
API管理ツールの機能追加にバグ
2025年5月29日(現地時間)、つまり今回の障害が発生する約2週間ほど前に、Google APIの管理ツールにおいて、APIの利用制限などのポリシーをチェックする「サービスコントロール」と呼ばれる機能に新たな機能追加が行われました。
この機能追加は世界中の各リージョンのサービスコントロールに対して行われました。この追加機能の中に今回の障害につながるバグが含まれていましたが、この追加機能はAPIの利用ポリシーが変更されない限り実行されなかったため、見過ごされてしまいました。
バグは、ヌルポインタを参照するとクラッシュするというものでした。適切なエラーハンドリングもなく、フィーチャーフラグによる無効化の初期設定も行われていませんでした。
もしフィーチャーフラグが適切に設定されていれば、このバグを含む機能はまずステージング環境において有効にされ、そこでクラッシュが発覚し、各リージョンで障害を起こす前に対処されていただろうと報告されています。
障害を引き起こすクラッシュが発生
障害発生当日、障害が発生する4分前(現地時間6月12日 10時45分)に、サービスコントロールが参照するポリシーの変更が行われます。
具体的には、ポリシーデータを格納しているGoogle Spannerのテーブルにデータが追加され、数秒で世界中の各リージョンのSpannerにレプリケートされました。
新しいポリシーデータには意図せず空白のフィールドが含まれており、これをサービスコントロールが読み込んで実行したところ、ヌルポインタ参照となりクラッシュが発生します。
世界中のリージョンで同じようにサービスコントロールのクラッシュが発生し、Google Cloudの障害を引き起こしました。
発表によると、障害発生時間は現地時間の10時49分です。
https://www.techno-edge.net/article/2025/06/16/4423.html
2分以内にSREチームが対処開始
- 4 : 2025/06/16(月) 22:06:32.95 ID:miOtlzpy
-
昔Google検索でも似たような事件あったよな
- 6 : 2025/06/16(月) 22:15:13.45 ID:W/Idx/He
-
いろはにほへとちりぬるぽ
- 25 : 2025/06/17(火) 03:32:30.37 ID:PNobK5nI
-
>>6
わガッよたれそつねならむ - 7 : 2025/06/16(月) 22:30:20.90 ID:XbVSSp5H
-
本当はナルと読むのが正しいらしいが、ヌルの方が不気味な雰囲気で良い。
- 9 : 2025/06/16(月) 22:38:39.53 ID:eJZbjrVO
-
自社AIでデバッグくらいしろよ
- 15 : 2025/06/16(月) 23:31:55.68 ID:QAZnnB9x
-
>>9
AIは大してデバッグしてくれない
自分はほぼ誤字脱字検出しか期待していない - 17 : 2025/06/16(月) 23:56:30.78 ID:OS6R1g36
-
>>15
AIとか大括りで話してるのは実際を知らないからだろ - 10 : 2025/06/16(月) 22:51:37.49 ID:VP/IGOjE
-
rustに切り替えるのかな?
- 12 : 2025/06/16(月) 23:07:26.54 ID:MM2Ikg2Z
-
Altはアルトじゃねえ!と言うレベルで無意味だよねえ、nullをナルと呼ぶのに文句つける人ってさ
マクドナルドも、カタカナでマクドナルドが日本語として正しいのと同じく、アルトとヌルでいいんだよ日本語として - 20 : 2025/06/17(火) 00:05:42.44 ID:+zyOca6y
-
>>12
んでもAltはオルトだ
音楽のコード名はC altはシーオルトだ
オルタードはむかーしから日本語だからな
だからサムアルトマンじゃなくサムオルトマンだぞ
リーガン大統領でなくレーガン大統領だし - 13 : 2025/06/16(月) 23:17:11.55 ID:9K6ipCuI
-
何故assertせんの?
- 14 : 2025/06/16(月) 23:29:39.45 ID:tpQrfbfT
-
あ なるほど
- 18 : 2025/06/17(火) 00:00:08.09 ID:5ZT/3SG/
-
鬱だシヌポ
- 19 : 2025/06/17(火) 00:03:34.82 ID:EoDSInSa
-
Googleの中の人が「ガッ!ガッ!」とか言いながらデバッグしてるんかのぉ
- 21 : 2025/06/17(火) 00:06:34.24 ID:EZseHdoE
-
Googleはオワコン
- 22 : 2025/06/17(火) 00:10:01.97 ID:/PtmLiNd
-
そう言えば503エラーとか出たな。
1回だけで気にも留めなかった - 23 : 2025/06/17(火) 00:17:25.12 ID:nrKbD4rH
-
俺のヌルポインタを参照すると、ケガをするぜー。
- 24 : 2025/06/17(火) 02:33:54.63 ID:2MkFUVT1
-
人間語作るからこうなるんだよ
生成AIにシステムを作らせればこんなミスは起きない - 26 : 2025/06/17(火) 05:40:29.39 ID:e3BWA1Fm
-
いまだにnull参照とかできんの?
プログラミング構造的に出来ないようにされたんじゃなかったんかよ
ほんま使えねー - 27 : 2025/06/17(火) 05:56:26.61 ID:onc99qfQ
-
俺も影響受けたわ
お客から問い合わせが来て「サービスが落ちてたみたいなんですけど原因なんですか」みたいに言われてガッとなった - 28 : 2025/06/17(火) 06:14:20.75 ID:UqSk/AFR
-
以外にガッが少なかったwwww
ガガガガッスレになってると思ったのにwww - 29 : 2025/06/17(火) 06:49:39.56 ID:fWQniHLt
-
オレの世代だとシンタックスエラーだよ
- 30 : 2025/06/17(火) 08:06:52.27 ID:RweAO5Cf
-
下手くそなんよ
向いてないともいうか - 32 : 2025/06/17(火) 09:12:50.32 ID:lFCdaoAt
-
ぬるぽが出る原因、桁幅オーバーとか
意外と単純なのな。 - 33 : 2025/06/17(火) 09:14:09.89 ID:5iebt0WU
-
しかし実行時のヌルポと文法ミスのシンタックスエラーじゃレベルが違いすぎる
コメント