全日空、データ同時抽出でエラー システム障害の原因発表

サムネイル
1 : 2023/04/07(金) 18:13:40.09 ID:FhkayRi79

全日本空輸は7日、3日発生したシステム障害の経緯を発表した。予約管理支援システムに対し同時に複数のデータを抽出しようとした際にエラーが起きたのが原因と結論づけた。加藤恭子執行役員はオンライン説明会で、エラーは「予期していないものだった」と偶発的な現象と強調した。

 データ抽出処理のプログラムに問題はなかった。エラーにより二つあるソフトウエアのうち一つの動作が停止。結果としてもう一つのソフトウエアに想定を超える負荷がかかり、監視プログラムが異常と検知してサーバー停止につながった。

 全日空は、今後同じようなエラーが起きてもサーバーが停止しないようシステムを改修する。

共同通信 2023/04/07 17:43 (JST)
https://nordot.app/1016992138647552000

2 : 2023/04/07(金) 18:14:44.54 ID:A7DqAols0
やっチャイナよ
3 : 2023/04/07(金) 18:14:54.87 ID:fHPThsUK0
結局NTTの障害とは関係なかったのか?
4 : 2023/04/07(金) 18:19:14.86 ID:FFEhuKZS0
share.exeを常駐させとけ(笑)
5 : 2023/04/07(金) 18:20:32.33 ID:uRIzxitC0
もう少しわかりやすい説明してくれよ
14 : 2023/04/07(金) 18:24:30.35 ID:rJLdrz6y0
>>5
執行役のおばさん、取材している記者いずれも理解できてないから無駄だよ
7 : 2023/04/07(金) 18:20:54.61 ID:AjNvc+6g0
同時を防ぐために排他制御がデータベースに働くんじゃないの?
教えて!SEのキモヲタたち
8 : 2023/04/07(金) 18:21:06.32 ID:3GD4yLMU0
同時に複数のデータを抽出が予期していないものなの
9 : 2023/04/07(金) 18:21:19.08 ID:nkAjylqO0
予想より混んでたんだろうな
これはしゃあない
10 : 2023/04/07(金) 18:22:38.78 ID:w3XvO5hQ0
予期しとけよ
個人商店のシステムじゃないぞ
11 : 2023/04/07(金) 18:23:31.02 ID:nb8do1300
監視プログラムのバグでもあるな
監視プログラムを監視するプログラムが必要
12 : 2023/04/07(金) 18:23:45.11 ID:OQTl9z+00
想定外のエラーで片系運用になって負荷に耐えられなかったってこと?
15 : 2023/04/07(金) 18:25:28.99 ID:nTWjGoFW0
間違えて変なテーブル結合して
巨大データひっぱろうとしたとか?
16 : 2023/04/07(金) 18:26:07.41 ID:jckcTq+J0
別々の(あまりそうしないが)ソフトウェアで冗長性を確保してたけど片方止まったんでもう片方に処理が集中して負荷閾値を超えた結果、監視システムがサーバーを止めた(多分サービスを止めたんだろう)
24 : 2023/04/07(金) 18:30:02.48 ID:nb8do1300
>>16
本当に閾値を超えたのかな?
単に急に負荷が増えたから、止めただけのように思える。
つまり、元から片方止まると両方止まるように設計されていたように思えるのだが。
29 : 2023/04/07(金) 18:36:09.72 ID:kPblnUkH0
>>24
B系がスタンバってるならそれでいいよな

A系を片肺運用する必要性はないわな

問題は、A系からB系の切り替えが、思いの外、時間がかかったことかね

18 : 2023/04/07(金) 18:27:36.66 ID:Do3ppvzh0
DBのエラー?嘘くせえ~
19 : 2023/04/07(金) 18:27:46.73 ID:25gusKXD0
まぁ監視系のPGが暴走することあるからしょうがないな
20 : 2023/04/07(金) 18:28:24.72 ID:pqLcEC8w0
デッドロックか
21 : 2023/04/07(金) 18:29:06.04 ID:6I+AfBb/0
これを防ぐために、銀行のシステムは
CPU が一個なんですよ

複数並列処理をやるからこうなる

23 : 2023/04/07(金) 18:29:42.84 ID:dElgjup70
>>1
前任喰うのシステムはよくやらかすよな
25 : 2023/04/07(金) 18:31:21.46 ID:kyj2ydXa0
そもそも1つでも処理が止まらないシステムがあって、それを複数持つことで冗長性持たせる物だろう。ケチりすぎたか?
26 : 2023/04/07(金) 18:31:46.32 ID:Do3ppvzh0
データ抽出処理に問題は無いのに、どうしてデータ抽出方法を改修するんですかねえ
27 : 2023/04/07(金) 18:33:49.76 ID:zT39PZ2+0
全日空だけにANAだらけのシステムとは
30 : 2023/04/07(金) 18:37:21.68 ID:f/G//HPC0
止めるのはいいけど、切り替え1時間は長い
31 : 2023/04/07(金) 18:38:50.16 ID:WOp/9Sk50
ノーロックしなかったか
32 : 2023/04/07(金) 18:39:59.41 ID:N/Dgn7pT0
NTTのせいにできなかったんだな
33 : 2023/04/07(金) 18:40:29.30 ID:Da5IwuF30
>>1
      ●
    _(_     トランザクション処理が、甘かったんだな・・・
   ( ゚ω゚ )
   '     `
34 : 2023/04/07(金) 18:42:07.53 ID:FPFLlv+f0
普通は片肺になってもある程度の動作が出来る様な設計にしておくものだと思っていたが?
片肺での運用テストとかやらなかったのかね?
35 : 2023/04/07(金) 18:43:20.02 ID:sqWN7E7R0
半世紀前から設計の最初に対策立てるところだろうに
36 : 2023/04/07(金) 18:46:22.26 ID:rEjpSgdE0
質問した人も回答した人も記事にした人もたぶん理解してないw
38 : 2023/04/07(金) 18:47:48.04 ID:rJLdrz6y0
チョット前だったらコロナの影響で運用担当が不足してたとかコロナのせいにできたのになw
39 : 2023/04/07(金) 18:47:52.24 ID:cTdpIunu0
> 予約管理支援システムへのデータ抽出の際に、A系のデータベース1に予期せぬエラー(データ抽出処理のプログラムに問題はなく、複数のデータ抽出処理を並列で同時に実行することによるデータベースの偶発的なエラー。担当者によると非常にまれに起きるエラー)が発生し、データベース1がフリーズした。
いや抽出でDBがフリーズしたらあかんやろ
40 : 2023/04/07(金) 18:48:00.61 ID:ZBGkp5rD0
ANA「インフラ屋のせい!」
41 : 2023/04/07(金) 18:49:15.57 ID:2F5Lqxza0
フリーズとか何なん?
分散トランザクションとかあるのか?
42 : 2023/04/07(金) 18:49:54.89 ID:JK868+on0
単純な参照ならともかく
更新を前提にロックかけながら参照するならいろいろありそうだが
46 : 2023/04/07(金) 18:51:44.96 ID:cTdpIunu0
>>42
デットロックに対して非常にまれなエラーとは言わんでしょ
49 : 2023/04/07(金) 18:53:45.39 ID:I1/NMw0k0
>>46
「デットロック」とも言わんよ

ただ読むだけの処理でないならそこで何かは起きうるだろ

43 : 2023/04/07(金) 18:50:25.56 ID:C0kPnOH40
パラレルクエリの実行中に、別の処理が入ってコンフリクトが起こった感じ?
DB、何使ってんだよ?ORACLE?MSSQL?
44 : 2023/04/07(金) 18:50:54.78 ID:4sCW8qmG0
で、アクセス負荷がーって言ってるけど
一つの動作が停止したエラーというのは問題ないのかね?

失敗じゃない、正常に中断したというJAXA的言い訳かな?

45 : 2023/04/07(金) 18:51:18.67 ID:HEf6/z1k0
インダウトトランザクションがあったのか?
47 : 2023/04/07(金) 18:51:56.96 ID:+oQfS2u00
>>1
相変わらずデジたんに弱いッシュねぇ
48 : 2023/04/07(金) 18:53:34.49 ID:iBKx6+Q90
まれに起こるの知ってたのか
ならこれからも起こるじゃん

コメント