原因はヌルポ。Google Cloudの大規模障害、原因は管理システムのヌルポインタ参照

サムネイル
1 : 2025/06/16(月) 21:51:28.99 ID:YOzPo3Jy

2025 Jun 16 12:31

新野淳一

Google Cloudは日本時間で6月13日金曜日の午前2時49分から約3時間のあいだ、Google Cloudの世界中のリージョンにおいてAPIへのアクセスに対して503エラーの発生が増加するなどの障害を起こしていました。

この影響でSpotifyやTwitch、NPM、Firebaseなど、Google Cloudを利用していた多くのサービスにも障害が発生することとなりました。

この障害の原因についてGoogle Cloudは6月15日に詳しい報告を公開しています。

報告によると、Google Cloud APIを外部に提供するために世界中の各リージョンに配置されているGoogle API管理ツールに追加した新機能に潜在的なバグがあり、適切なエラーハンドリングやフィーチャーフラグが働かない状態でヌルポインタを参照しクラッシュ。

世界中の各リージョンでほぼ同時にこのクラッシュが発生したことが障害の原因だとしています。

時系列で何が起きたかをまとめました。

API管理ツールの機能追加にバグ

2025年5月29日(現地時間)、つまり今回の障害が発生する約2週間ほど前に、Google APIの管理ツールにおいて、APIの利用制限などのポリシーをチェックする「サービスコントロール」と呼ばれる機能に新たな機能追加が行われました。

この機能追加は世界中の各リージョンのサービスコントロールに対して行われました。この追加機能の中に今回の障害につながるバグが含まれていましたが、この追加機能はAPIの利用ポリシーが変更されない限り実行されなかったため、見過ごされてしまいました。

バグは、ヌルポインタを参照するとクラッシュするというものでした。適切なエラーハンドリングもなく、フィーチャーフラグによる無効化の初期設定も行われていませんでした。

もしフィーチャーフラグが適切に設定されていれば、このバグを含む機能はまずステージング環境において有効にされ、そこでクラッシュが発覚し、各リージョンで障害を起こす前に対処されていただろうと報告されています。

障害を引き起こすクラッシュが発生

障害発生当日、障害が発生する4分前(現地時間6月12日 10時45分)に、サービスコントロールが参照するポリシーの変更が行われます。

具体的には、ポリシーデータを格納しているGoogle Spannerのテーブルにデータが追加され、数秒で世界中の各リージョンのSpannerにレプリケートされました。

新しいポリシーデータには意図せず空白のフィールドが含まれており、これをサービスコントロールが読み込んで実行したところ、ヌルポインタ参照となりクラッシュが発生します。

世界中のリージョンで同じようにサービスコントロールのクラッシュが発生し、Google Cloudの障害を引き起こしました。

発表によると、障害発生時間は現地時間の10時49分です。

https://www.techno-edge.net/article/2025/06/16/4423.html

2分以内にSREチームが対処開始

4 : 2025/06/16(月) 22:06:32.95 ID:miOtlzpy
昔Google検索でも似たような事件あったよな
6 : 2025/06/16(月) 22:15:13.45 ID:W/Idx/He
いろはにほへとちりぬるぽ
25 : 2025/06/17(火) 03:32:30.37 ID:PNobK5nI
>>6
わガッよたれそつねならむ
7 : 2025/06/16(月) 22:30:20.90 ID:XbVSSp5H
本当はナルと読むのが正しいらしいが、ヌルの方が不気味な雰囲気で良い。
9 : 2025/06/16(月) 22:38:39.53 ID:eJZbjrVO
自社AIでデバッグくらいしろよ
15 : 2025/06/16(月) 23:31:55.68 ID:QAZnnB9x
>>9
AIは大してデバッグしてくれない
自分はほぼ誤字脱字検出しか期待していない
17 : 2025/06/16(月) 23:56:30.78 ID:OS6R1g36
>>15
AIとか大括りで話してるのは実際を知らないからだろ
10 : 2025/06/16(月) 22:51:37.49 ID:VP/IGOjE
rustに切り替えるのかな?
12 : 2025/06/16(月) 23:07:26.54 ID:MM2Ikg2Z
Altはアルトじゃねえ!と言うレベルで無意味だよねえ、nullをナルと呼ぶのに文句つける人ってさ
マクドナルドも、カタカナでマクドナルドが日本語として正しいのと同じく、アルトとヌルでいいんだよ日本語として
20 : 2025/06/17(火) 00:05:42.44 ID:+zyOca6y
>>12
んでもAltはオルトだ
音楽のコード名はC altはシーオルトだ
オルタードはむかーしから日本語だからな
だからサムアルトマンじゃなくサムオルトマンだぞ
リーガン大統領でなくレーガン大統領だし
13 : 2025/06/16(月) 23:17:11.55 ID:9K6ipCuI
何故assertせんの?
14 : 2025/06/16(月) 23:29:39.45 ID:tpQrfbfT
あ なるほど
18 : 2025/06/17(火) 00:00:08.09 ID:5ZT/3SG/
鬱だシヌポ
19 : 2025/06/17(火) 00:03:34.82 ID:EoDSInSa
Googleの中の人が「ガッ!ガッ!」とか言いながらデバッグしてるんかのぉ
21 : 2025/06/17(火) 00:06:34.24 ID:EZseHdoE
Googleはオワコン
22 : 2025/06/17(火) 00:10:01.97 ID:/PtmLiNd
そう言えば503エラーとか出たな。
1回だけで気にも留めなかった
23 : 2025/06/17(火) 00:17:25.12 ID:nrKbD4rH
俺のヌルポインタを参照すると、ケガをするぜー。
24 : 2025/06/17(火) 02:33:54.63 ID:2MkFUVT1
人間語作るからこうなるんだよ
生成AIにシステムを作らせればこんなミスは起きない
26 : 2025/06/17(火) 05:40:29.39 ID:e3BWA1Fm
いまだにnull参照とかできんの?
プログラミング構造的に出来ないようにされたんじゃなかったんかよ
ほんま使えねー
27 : 2025/06/17(火) 05:56:26.61 ID:onc99qfQ
俺も影響受けたわ
お客から問い合わせが来て「サービスが落ちてたみたいなんですけど原因なんですか」みたいに言われてガッとなった
28 : 2025/06/17(火) 06:14:20.75 ID:UqSk/AFR
以外にガッが少なかったwwww
ガガガガッスレになってると思ったのにwww
29 : 2025/06/17(火) 06:49:39.56 ID:fWQniHLt
オレの世代だとシンタックスエラーだよ
30 : 2025/06/17(火) 08:06:52.27 ID:RweAO5Cf
下手くそなんよ
向いてないともいうか
32 : 2025/06/17(火) 09:12:50.32 ID:lFCdaoAt
ぬるぽが出る原因、桁幅オーバーとか
意外と単純なのな。
33 : 2025/06/17(火) 09:14:09.89 ID:5iebt0WU
しかし実行時のヌルポと文法ミスのシンタックスエラーじゃレベルが違いすぎる

コメント