「au大規模通信障害」はKDDIだけの問題ではない 輻輳を防ぐための技術基準見直しも必要か?

著者フォロー
ブックマーク

記事をマイページに保存
できます。
無料会員登録はこちら
はこちら

印刷ページの表示はログインが必要です。

無料会員登録はこちら

はこちら

縮小

この時点で、該当ネットワークセンターにつながる端末(主にスマートフォン)では音声通話が使えない状態だが、全国に問題が広がっていたわけではない。ルーターの問題発生アラートが上がり、一部端末で音声通話ができない状態であることがわかったため、15分後の1時50分にシステムを切り戻し(フォールバック処理、システム更新で問題が起きた場合に正常だった元のシステムに戻すこと)が行われた。

直後にKDDIは事故対策本部を立ち上げ、障害対策の準備を始めるが、2時17分にはVoLTE交換機への輻輳が発生。音声通話のサービスに極端に接続しづらい状況となった。この時点で一部端末ではデータ通信も不通になった模様だ。

輻輳とは通信要求が集中し能力を超えてしまうことで応答が極端に遅くなり、通信内容の破棄や再送信が繰り返し発生するなど、さまざまな理由により有効な通信帯域が極端に減じてしまう現象だ。輻輳が発生すると何らかの制限、制御を行わない限り、事実上、通信不能になってしまう。

今回の場合、VoLTE交換機に接続できなくなっていた端末が、最初の問題を発生させたシステムをフォールバックさせた際、一斉にVoLTE交換機にアクセスしたことで発生したという。

KDDI自身、まだシステムログ(システムがどのように動いたかの記録)を分析しきれていない段階であると話しており、なぜ輻輳するに至ったのか細かな経緯はわかっていない。というのも、その後、KDDIが当初想定していた範囲外まで障害の領域が広がっていたからだ。

不明点が多い障害拡大のプロセス

VoLTE交換機へのアクセス障害を復旧させたことで、一気に端末からの接続要求が集中、輻輳に至ったというKDDIの説明だが、実際に輻輳するまでの経緯は実のところよくわかっていない。

VoLTE端末は通話を利用しない場合でも、50分に1度、VoLTE交換機との接続を確立させる設計になっている。通常ならばランダムなタイミングで行われる接続だが、15分間停止したことで一気にまとまった数の端末が、VoLTE交換機にアクセスしたのかもしれない。

次ページ15分という時間が問題?
関連記事
トピックボードAD
ビジネスの人気記事