「au大規模通信障害」はKDDIだけの問題ではない 輻輳を防ぐための技術基準見直しも必要か?

著者フォロー
ブックマーク

記事をマイページに保存
できます。
無料会員登録はこちら
はこちら

印刷ページの表示はログインが必要です。

無料会員登録はこちら

はこちら

縮小

ただしKDDIは「15分という時間が問題だったのか、もっと短くとも同じことが起きるのかを含め、現時点では短時間で輻輳に至った原因は突き止められていない」とも話した。

KDDIは全国6拠点で18台のVoLTE交換機を運用している。VoLTE交換機への接続要求がある程度集中し、応答が遅れることはあったとしても、ごく短時間、問題が起きることがあったとしても、全国の拠点で接続要求を分けあう仕組みがあるという。

ルーターに問題を抱えた状況では、そうした負荷の分散もできなかっただろうが、復旧させた時点でそうしたシステム側の対策は動いていたと推察される。

また3時からは基地局への信号接続要求の制限、VoLTE交換機への発呼処理のリセットと流量制限を実施し、その後、データ、音声ともにさらなる流量制限を行うことで鎮静化を図ろうとした。

端末からの要求を事業者側が制御することはできないが、基地局側で接続を制限すれば輻輳を緩和できる。災害時に固定電話の通話制限を行うことで輻輳を緩和するのと同様の措置だ。

ところが今回はそれだけでは問題が収まらなかった。

加入者データベースにも輻輳が発生

携帯電話ネットワークでは加入者データベース(DB)という規模の大きな、そしてシステム稼働のうえで極めて重要なデータベースがある。このデータベースには接続している全端末の識別子、課金情報、データセッション、VoLTEパラメーター、位置情報などが格納され、サービスを提供する際に必ず参照、定期的に更新されている。

この加入者DBにも輻輳が発生していたからだ。

音声通話サービスを行うために、加入者DBを管理する装置(PWG)はその情報をVoLTE交換機に送っている。ところが輻輳が発生しているため、加入者DBの情報をVoLTE交換機に送っても応答せず、ここでも輻輳が発生していたという。

そこで加入者DBからVoLTE交換機へのアクセスを制限するため、一部のPWGを切り離すことでVoLTE交換機へのアクセス負荷低減を行った。これが15時22分の段階だ。ところが、これでもサービスは正常にならなかった。

なぜなら加入者DBの内容が、完全には同期されない状態になってしまっていたからだ。そこで、すべてのPWGを切り離してDBのデータ不一致を解消する作業を進め、修正対策の作業が完了したのが、西日本エリアは翌3日の11時、東日本エリアは17時30分。

次ページ輻輳を防ぐためには…
関連記事
トピックボードAD
ビジネスの人気記事