- 1 : 2023/04/07(金) 18:13:40.09 ID:FhkayRi79
-
全日本空輸は7日、3日発生したシステム障害の経緯を発表した。予約管理支援システムに対し同時に複数のデータを抽出しようとした際にエラーが起きたのが原因と結論づけた。加藤恭子執行役員はオンライン説明会で、エラーは「予期していないものだった」と偶発的な現象と強調した。
データ抽出処理のプログラムに問題はなかった。エラーにより二つあるソフトウエアのうち一つの動作が停止。結果としてもう一つのソフトウエアに想定を超える負荷がかかり、監視プログラムが異常と検知してサーバー停止につながった。
全日空は、今後同じようなエラーが起きてもサーバーが停止しないようシステムを改修する。
共同通信 2023/04/07 17:43 (JST)
https://nordot.app/1016992138647552000 - 2 : 2023/04/07(金) 18:14:44.54 ID:A7DqAols0
-
やっチャイナよ
- 3 : 2023/04/07(金) 18:14:54.87 ID:fHPThsUK0
-
結局NTTの障害とは関係なかったのか?
- 4 : 2023/04/07(金) 18:19:14.86 ID:FFEhuKZS0
-
share.exeを常駐させとけ(笑)
- 5 : 2023/04/07(金) 18:20:32.33 ID:uRIzxitC0
-
もう少しわかりやすい説明してくれよ
- 14 : 2023/04/07(金) 18:24:30.35 ID:rJLdrz6y0
-
>>5
執行役のおばさん、取材している記者いずれも理解できてないから無駄だよ - 7 : 2023/04/07(金) 18:20:54.61 ID:AjNvc+6g0
-
同時を防ぐために排他制御がデータベースに働くんじゃないの?
教えて!SEのキモヲタたち - 8 : 2023/04/07(金) 18:21:06.32 ID:3GD4yLMU0
-
同時に複数のデータを抽出が予期していないものなの
- 9 : 2023/04/07(金) 18:21:19.08 ID:nkAjylqO0
-
予想より混んでたんだろうな
これはしゃあない - 10 : 2023/04/07(金) 18:22:38.78 ID:w3XvO5hQ0
-
予期しとけよ
個人商店のシステムじゃないぞ - 11 : 2023/04/07(金) 18:23:31.02 ID:nb8do1300
-
監視プログラムのバグでもあるな
監視プログラムを監視するプログラムが必要 - 12 : 2023/04/07(金) 18:23:45.11 ID:OQTl9z+00
-
想定外のエラーで片系運用になって負荷に耐えられなかったってこと?
- 15 : 2023/04/07(金) 18:25:28.99 ID:nTWjGoFW0
-
間違えて変なテーブル結合して
巨大データひっぱろうとしたとか? - 16 : 2023/04/07(金) 18:26:07.41 ID:jckcTq+J0
-
別々の(あまりそうしないが)ソフトウェアで冗長性を確保してたけど片方止まったんでもう片方に処理が集中して負荷閾値を超えた結果、監視システムがサーバーを止めた(多分サービスを止めたんだろう)
- 24 : 2023/04/07(金) 18:30:02.48 ID:nb8do1300
-
>>16
本当に閾値を超えたのかな?
単に急に負荷が増えたから、止めただけのように思える。
つまり、元から片方止まると両方止まるように設計されていたように思えるのだが。 - 29 : 2023/04/07(金) 18:36:09.72 ID:kPblnUkH0
-
>>24
B系がスタンバってるならそれでいいよなA系を片肺運用する必要性はないわな
問題は、A系からB系の切り替えが、思いの外、時間がかかったことかね
- 18 : 2023/04/07(金) 18:27:36.66 ID:Do3ppvzh0
-
DBのエラー?嘘くせえ~
- 19 : 2023/04/07(金) 18:27:46.73 ID:25gusKXD0
-
まぁ監視系のPGが暴走することあるからしょうがないな
- 20 : 2023/04/07(金) 18:28:24.72 ID:pqLcEC8w0
-
デッドロックか
- 21 : 2023/04/07(金) 18:29:06.04 ID:6I+AfBb/0
-
これを防ぐために、銀行のシステムは
CPU が一個なんですよ複数並列処理をやるからこうなる
- 23 : 2023/04/07(金) 18:29:42.84 ID:dElgjup70
-
>>1
前任喰うのシステムはよくやらかすよな - 25 : 2023/04/07(金) 18:31:21.46 ID:kyj2ydXa0
-
そもそも1つでも処理が止まらないシステムがあって、それを複数持つことで冗長性持たせる物だろう。ケチりすぎたか?
- 26 : 2023/04/07(金) 18:31:46.32 ID:Do3ppvzh0
-
データ抽出処理に問題は無いのに、どうしてデータ抽出方法を改修するんですかねえ
- 27 : 2023/04/07(金) 18:33:49.76 ID:zT39PZ2+0
-
全日空だけにANAだらけのシステムとは
- 30 : 2023/04/07(金) 18:37:21.68 ID:f/G//HPC0
-
止めるのはいいけど、切り替え1時間は長い
- 31 : 2023/04/07(金) 18:38:50.16 ID:WOp/9Sk50
-
ノーロックしなかったか
- 32 : 2023/04/07(金) 18:39:59.41 ID:N/Dgn7pT0
-
NTTのせいにできなかったんだな
- 33 : 2023/04/07(金) 18:40:29.30 ID:Da5IwuF30
-
>>1
●
_(_ トランザクション処理が、甘かったんだな・・・
( ゚ω゚ )
' ` - 34 : 2023/04/07(金) 18:42:07.53 ID:FPFLlv+f0
-
普通は片肺になってもある程度の動作が出来る様な設計にしておくものだと思っていたが?
片肺での運用テストとかやらなかったのかね? - 35 : 2023/04/07(金) 18:43:20.02 ID:sqWN7E7R0
-
半世紀前から設計の最初に対策立てるところだろうに
- 36 : 2023/04/07(金) 18:46:22.26 ID:rEjpSgdE0
-
質問した人も回答した人も記事にした人もたぶん理解してないw
- 38 : 2023/04/07(金) 18:47:48.04 ID:rJLdrz6y0
-
チョット前だったらコロナの影響で運用担当が不足してたとかコロナのせいにできたのになw
- 39 : 2023/04/07(金) 18:47:52.24 ID:cTdpIunu0
-
> 予約管理支援システムへのデータ抽出の際に、A系のデータベース1に予期せぬエラー(データ抽出処理のプログラムに問題はなく、複数のデータ抽出処理を並列で同時に実行することによるデータベースの偶発的なエラー。担当者によると非常にまれに起きるエラー)が発生し、データベース1がフリーズした。
いや抽出でDBがフリーズしたらあかんやろ - 40 : 2023/04/07(金) 18:48:00.61 ID:ZBGkp5rD0
-
ANA「インフラ屋のせい!」
- 41 : 2023/04/07(金) 18:49:15.57 ID:2F5Lqxza0
-
フリーズとか何なん?
分散トランザクションとかあるのか? - 42 : 2023/04/07(金) 18:49:54.89 ID:JK868+on0
-
単純な参照ならともかく
更新を前提にロックかけながら参照するならいろいろありそうだが - 46 : 2023/04/07(金) 18:51:44.96 ID:cTdpIunu0
-
>>42
デットロックに対して非常にまれなエラーとは言わんでしょ - 49 : 2023/04/07(金) 18:53:45.39 ID:I1/NMw0k0
-
>>46
「デットロック」とも言わんよただ読むだけの処理でないならそこで何かは起きうるだろ
- 43 : 2023/04/07(金) 18:50:25.56 ID:C0kPnOH40
-
パラレルクエリの実行中に、別の処理が入ってコンフリクトが起こった感じ?
DB、何使ってんだよ?ORACLE?MSSQL? - 44 : 2023/04/07(金) 18:50:54.78 ID:4sCW8qmG0
-
で、アクセス負荷がーって言ってるけど
一つの動作が停止したエラーというのは問題ないのかね?失敗じゃない、正常に中断したというJAXA的言い訳かな?
- 45 : 2023/04/07(金) 18:51:18.67 ID:HEf6/z1k0
-
インダウトトランザクションがあったのか?
- 47 : 2023/04/07(金) 18:51:56.96 ID:+oQfS2u00
-
>>1
相変わらずデジたんに弱いッシュねぇ - 48 : 2023/04/07(金) 18:53:34.49 ID:iBKx6+Q90
-
まれに起こるの知ってたのか
ならこれからも起こるじゃん
コメント