2022年7月2日に発生したKDDIの通信障害は、復旧までに86時間を要し、多岐にわたって非常に大きな社会的影響を引きおこしました。
5G、そして6G時代に向けて、モバイル通信の利用がより広がっていくにつれ、通信障害の影響は大きなものになると考えられます。
そのため障害発生時の復旧を、自動化する取り組みが進められてきているようです。
機器の増加や複雑化でさらに通信障害が発生しやすい環境に
2022年7月2日にKDDIが発生させた通信障害は、非常に大規模なもので、その後3日以上にわたって影響が続きました。
影響が出たのは主として音声通話で、緊急通報が不可になるなど、非常に深刻な影響をもたらしました。
それに加えて、ATMや気象観測所などが同社の回線を利用していたことから、影響は携帯電話やスマートフォン以外にも及び注目されました。
通信障害の原因は、まだ完全にわかった訳ではありませんが、経緯をたどると、同社のコアネットワーク内にあるルータ交換という、通常のメンテナンス作業がきっかけとなったようです。
ルータ交換のために、音声通話のトラフィックルートを変更したところ、一部の音声通話が約15分間、原因不明の不通になってしまったとのことです。
そこでルートを元に戻したのですが、不通になっていた間に溜まったスマートフォンなどからのアクセスが殺到し、4Gの音声通話を処理するVoLTE交換機が輻輳(ふくそう)状態となりました。
それがネットワークの他の場所にも広がり、大規模障害へつながったようです。
輻輳による大規模障害といえば、2021年10月に、NTTドコモがおこした通信障害が思い起こされるのではないでしょうか。
この時はIoT向けのネットワークで、機器を交換する際に不具合が発生しました。
元の機器に戻し、IoT端末の位置情報を加入者データベースに登録し直そうとしたのですが、その数が20万にも上ったために間に合わず輻輳が発生しました。
それが他の場所の輻輳につながり、大規模障害を引きおこしました。
現在では、多数のIoT機器がネットワークに接続するようになったのに加え、携帯電話からスマートフォンに進化したので、その高性能を利用するため、高い頻度でネットワークにアクセスするようになりました。
それゆえに、日ごろからネットワークに大きな負荷がかかり、メンテナンス作業中の些細なトラブルで輻輳が起きやすく、大規模障害に発展しやすい様子が一連の障害事例から見て取ることができます。
そうした傾向は、今後、一層加速するものと考えられます。
なぜなら、5Gが本格化すると、企業でのモバイル通信利用が増加したり、デバイスが高度化したりするからです。
そのため輻輳による大規模通信障害は、今後さらに発生しやすくなると考えられます。
そして、障害発生時の社会的影響に対処するのは、1社だけでは困難です。
そこで、各携帯電話会社間でのローミングや、緊急通報手段の確保など、社会全体で影響を抑える仕組み作りが求められています。
通信障害の復旧作業自動化は加速している
携帯電話会社もまた、通信障害が起きやすい時代に向けての対応を進めています。
例えばNTTドコモでは、大規模障害以降、通信障害の影響を抑えるために、一般ユーザー向けとIoT向けのネットワークを切り離す措置が取られるようになりました。
今回のKDDIの場合も、IoT向け通信はネットワークが分けられていたため、1500万回線のうち最大で150万回線と影響は10分の1にとどまっています。
また、その多くは音声通話の仕組みを用いるSMSを使ったものに限られるようです。
そして、ネットワーク障害の検知や復旧などの保守運用業務の自動化がより大きな動きとなっています。
ネットワークが進化するにつれ、保守運用業務も複雑化してきました。
携帯各社は、手作業での対応に限界を感じ、それらの自動化を進めています。
例えば楽天モバイルは、完全仮想化で大部分をソフトで対処できるというネットワークの特性を生かし、保守運用の自動化に力を入れています。
また、NTTドコモも「ゼロタッチオペレーション構想」を掲げ、自動化に向けた取り組みを推進しています。
KDDIも同じように、積極的に保守運用業務の自動化を進めています。
新たに東京都多摩市に設けられたネットワーク運用拠点では、災害や障害発生時、人手によって実施されてきた従来の復旧作業などの自動化を進め、早期復旧につなげる取り組みをしてきました。
さらにKDDIは、総務省の研究の一環として、「AIネットワーク統合基盤」を使った5Gネットワーク障害時の自動復旧システムの有効性を確認する実証実験を、日立製作所や沖電気工業などと2021年1月より実施しています。
AIが通信障害を検知して、自動的にネットワークの再構築を図る検証が進められています。
ただ今回の障害は、それらの自動化がまだ進んでいない部分で発生したため、復旧作業自動化の実現には至らなかったようです。
しかし、KDDIは今回の障害の反省を受け、より多くの部分の輻輳に対応できるよう、今後、システムの自動化を強化していくことが考えられます。
ちなみに、日本でのBeyond 5G、6Gに向けた取り組みを推進している「Beyond 5G推進コンソーシアム」が求めているBeyond 5Gの機能には、瞬時に災害や障害から復旧する「超安全・信頼性」が含まれています。
今後、ネットワークの必須条件に、通信障害からの自動復旧があげられる可能性は高いといえます。
それゆえに、今後6Gの標準化を進めるために注目するべきは、ネットワーク性能の高度化はもとより、通信障害を未然に防ぐ技術の確立が必要です。
参照 マイナビニュース
LEAVE A REPLY