法林岳之の「週刊モバイルCATCH UP」

KDDIの大規模障害から考えるモバイルネットワークの課題

 7月2日(土)未明から起きていたKDDIの大規模なネットワーク障害。最大3915万回線、のべ80時間を超える規模の障害は、7月5日15時36分に音声通話・データ通信ともに全国的に回復していることを確認して、ひとまず復旧となった。

7月4日の会見で示された資料より

 震災などを除けば、国内で起きた通信障害として、最大級のものであり、スマートフォンや携帯電話以外のさまざまなサービスに影響を与えてしまった。

 今回はauの大規模障害から見えてくるモバイルネットワークの課題、ユーザーとしての対応などについて、考えてみよう。

過去最大級のネットワーク障害

 スマートフォンや携帯電話は『電波』を使い、基地局とつながっているが、その背後には各携帯電話会社が構築したモバイルネットワークが存在する。本誌にも各社のネットワーク運用センター(ネットワークセンター)やデータセンターの取材記事が何度となく掲載されてきたが、各社とも災害などのトラブルに備えるなど、モバイルネットワークが常に安定して動作するように、運用や管理、保守を行なっている。

 今回のKDDIで起きたネットワーク障害は、まさにそのモバイルネットワークの中枢部分をメンテナンスするうえで、設備障害が発生し、それが他の機器にも影響を及んだことによって、全国規模に影響が拡大してしまった。

 影響を受けた範囲は、auやUQモバイル、povoのスマートフォンや携帯電話を利用するユーザー(個人・法人)に留まらず、auネットワークを利用したMVNO各社、IoT回線、ホームプラス電話など、最大約3915万回線が影響を受けた。

 今回のネットワーク障害によって、一部の観測点で気象データの収集ができなかったり、空港スタッフ用の無線機の一部利用不可、金融機関の一部のATMの利用不可、つながるクルマ向けのサービスの一部が利用不可など、auのモバイルネットワークを利用した多様なサービスにも影響が及び、生活や社会を支えるインフラ全体へインパクトを与えることになってしまった。

auのネットワークに何が起きたのか

 今回のネットワーク障害については、7月3日午前、7月4日夜、7月5日夜に行なわれた記者説明会で説明された内容が本誌記事に掲載されているので、詳しくは説明しないが、簡単に流れを振り返ってみよう。

 まず、KDDIでは7月1日深夜(7月2日午前1時)、定期的なメンテナンスの一環として、モバイルコア網と全国中継網をつなぐルーターを交換する作業をしたところ、設備に不具合が発生し、音声トラヒックのルート変更がされず、約15分間、音声通信(VoLTE)の不通が起きてしまった。

 そこで、機材や設定を元に戻す「ルート変更の切り戻し」を実施したところ、不通だった端末からの再接続要求がモバイルコア網のVoLTE交換機に集中し、全国的に輻輳(ふくそう)が起きてしまった。同時に加入者データベースにもアクセスが集中し、データの不一致が発生。 ちなみに、「輻輳」とは信号やデータが集中して、混雑した状態のこと を指し、大規模な輻輳によって、ネットワーク全体が停止してしまうこともある。

 こうした状況に対し、KDDIではVoLTE交換機の負荷を低減するため、通信を制限する一方、加入者データベースについても負荷を低減しながら、データ不一致の修正に対処するなどの対応が採られた。しかし、障害が復旧しないため、ネットワーク設備のセッションリセットなど、やや大がかりな対応も採られたという。7月3日午前の記者説明会の段階では、これらの復旧作業の内、西日本エリアについては同日11時に終了し、東日本エリアについては17時30分に終了する予定だとアナウンスされた。

 ところが、復旧作業を完了してもVoLTE交換機と加入者データベースの負荷が十分に軽減しないため、7月4日午前の段階ではKDDIのWebページに「流量制御などの対処を講じているため、音声通話がご利用しづらい状況が継続しております。」というお知らせが掲載されていた。

 その後、VoLTE交換機から加入者データベースへ不要な過剰信号が送出されていることがわかり、18台中6台のVoLTE交換機をネットワークから切り離す対処をしたことで、VoLTE交換機と加入者データベースの負荷が軽減し、一定時間経過後、負荷が障害発生前と同水準に落ち着いたという。

 ユーザーの発着信成功率も向上したことを受け、7月4日14時51分に無線設備の流量制御が解除された。7月5日は終日、ネットワーク状況の監視や利用状況の確認が行なわれ、最終的に同日15時36分に通常と変わらないレベルに落ち着いたことが確認され、回復した旨がアナウンスされた。

音声通話やSMSがつながらず、データ通信も不調

 80時間以上に及ぶ今回の障害では、多くのユーザーの利用環境にさまざまな影響が及んだ。音声通話が使えないばかりか、SMSの送受信不可、データ通信も速度低下が切断などが起きた。

 ただ、これらの事象はすべてのユーザーに同じように起きていたわけではなく、一部のユーザーはデータ通信が利用できたり、アンテナピクトが表示されていないのに通信が使えたという例もあった。現に、筆者の環境では障害によって、流量(データや信号の流れ)が制限されていた7月2日の段階で、auのメイン回線として利用している「Galaxy S22 Ultra」はアンテナピクトが表示され、データ通信が利用できていたのに対し、同じau回線の「iPhone 13 Pro Max」はアンテナピクトが表示されないものの、データ通信は利用できることがあった。ただし、いずれも復旧までは音声通話が使えなかった。auのネットワークを利用したMVNOサービスについては、各社を試したわけではないが、やはり、データ通信が利用できなかったり、音声通話が発信できないなどの事象が確認できた。

 今回のネットワーク障害は、地域や機種、MVNO事業者などの違いで、障害の内容が一律ではなかったようだ。たとえば、筆者のように、AndroidスマートフォンとiPhoneでアンテナピクトの表示が違ったケースもあれば、記者説明会でも触れられたように、iPhoneで利用できていたケースもあったという。

 同じ場所に居る2台のAndroidスマートフォン(同じ機種)でも片方は使えるのに、もう片方は使えなかったり、auのモバイルネットワークを利用した同じMVNOでも不通のままの人も居れば、データ通信が使えたとする投稿も見かけた。このあたりは障害の詳細な原因分析を待つしかないが、これまでのような障害と少し事象の内容が異なるような印象があった。

モバイルネットワークが使えない怖さ

 スマートフォンや携帯電話などが利用できるモバイルネットワークは、今や私たちの生活にもビジネスにも欠かすことができない社会インフラとなっている。今回のネットワーク障害では、改めて、その重要性が再認識させられた。

 モバイルネットワークの障害については、これまでも2021年のNTTドコモ、2018年のソフトバンクなど、何度か起きているが、今回は障害が週末に起き、期間も約3日間と長かったことから、影響の範囲もかなり大きかった。音声通話の発着信ができないため、110番や119番などの緊急通報が使えなかったり、医療機関内での連絡に支障を来たすなど、命に関わる現場への影響が出てしまった。日常生活においてもデータ通信が利用できないため、金融機関のATMが利用できなかったり、au PAYをはじめとするQRコード/バーコード決済による支払いができないなどのトラブルが報告されている。

 また、つながるクルマ向けのサービスが利用できなかったことについて、記者説明会では「将来的に、自動運転などの時代になったとき、こういう障害が起きると、たいへんなことになる」という指摘もあった。現実的には、通信が切断されたときは車両が停止し、手動での運転に切り替えられるだろうが、最近では遠隔医療をはじめ、建設機械のリモート操作など、5Gネットワークを活用したサービスが数多く開発されており、当然のことながら、障害が起きれば、いずれのサービスでも運用が停止することになる。

 さすがに、通信が切断されたことで、機械が暴走するといった事態は、ややSF映画の見過ぎという感もあるが、モバイルネットワークを組み込んだサービスを提供するうえで、通信が切断されるかもしれないことを十分に考慮したうえで、サービスを設計し、構築しなければならないことがより明確になったとも言えるだろう。

つながらないことをどう伝えるか

 今回の障害では、つながらない状況を確認するため、一部のユーザーがauショップを相次いで訪れたことも伝えられた。店頭に行列ができたり、店内でショップスタッフが強く叱責されるような場面も見かけられたという。サポートやコールセンターへの問い合わせもかなり多かったようで、「今日はずっと謝っていた」という関係者と思われる投稿なども見かけた。

KDDI髙橋社長

 また、今回の障害発生時、KDDIの代表取締役社長の髙橋誠氏は、当初、自身の携帯電話がつながらないため、障害報の連絡がすぐに届かず、固定電話への連絡によって、障害の状況が伝えられ、早朝に新宿のオペレーションセンターへ駆け付けることになったという。高橋社長に限らず、おそらくKDDI関係者の間での連絡も音声通話が使えないがゆえの手間が増えたことが容易に想像できる。

 これらの状況を鑑みると、 万が一のとき、「つながらないこと」「障害が起きていること」をユーザーに対して、どう伝えていくかが非常に重要 になってくる。今回、KDDIは「Webページに障害情報を掲載した」と説明していたが、インターネットの利用環境がスマートフォンのみに限られているユーザー、もしくは移動中や外出中でモバイル回線しか利用できないユーザーは、Webページを見ることができず、Wi-Fiなどで接続したときに、ニュースサイトなどを見て、はじめて障害を知るという状況だった。

 たとえば、7月2日夕方、筆者が訪れた飲食店では、顔見知りのスタッフが自身のiPhoneを持ってきて、「法林さん、今朝から電話がつながらないんですけど、故障ですかね?」と話しかけてきた。そこで、KDDIの障害を伝え、Wi-Fiでインターネットに接続すれば、LINEなどが利用できることを説明すると、「わかりました。じゃあ、LINEで連絡してみます」と答えていた。

 また、こうした携帯電話会社からのお知らせとして、これまで確実とされてきたSMS(+メッセージ)も今回の障害では利用できなかったため、周知に使うことができなかった。SMSが利用できないことは、インターネットで提供されているサービスの二段階認証が利用できないというトラブルも招き、障害復旧時はauをかたる迷惑メッセージ(詐欺メッセージ)が送られ、注意喚起が伝えられるなど、二次的な影響もあった。

 障害が起きている情報をいかに伝えていくかは、今後、KDDIに限らず、携帯電話会社やMVNO各社が取り組んでいくことになるが、今回起きた障害が復旧するまでの過程においても何度か改善すべき点が見受けられた。

 7月3日~5日まで、連日、行なわれた記者説明会で筆者も質問したが、障害が起きた7月2日の段階では、一部のショップに障害が起きていることの貼り紙もなかった。もし、貼り紙があれば、通りすがりのユーザーが知ることができるだろうし、ショップで問い合わせの行列が並ぶこともある程度、抑えられたかもしれない。各auショップを運営する代理店をコントロールするKDDIの営業部門にもしっかりと危機感を持って、取り組んで欲しいところだ。

 また、7月5日の記者説明会の質疑応答で指摘したが、KDDIは障害の復旧と内容の説明に追われるばかりで、せっかく連日の会見に各メディアが集まっているにもかかわらず、ユーザーへの周知にうまく利用できなかった。

 モバイルネットワークの障害が復旧するときは、停電から電力が回復するときと違い、徐々にユーザーの端末がネットワークにつながっていく。ごく簡単に説明すると、障害が復旧し、モバイルネットワークから切断されていた端末は基地局からの電波をつかむようになると、各社のモバイルネットワークの加入者データベースを参照したうえで、実際にネットワークに接続されるという流れになる。このとき、端末がモバイルネットワークを参照したり、接続を試みようとするタイミングは、直前のセッションがどうなっているか、あるいはネットワークやプラットフォームの仕様がどうなっているのかによって、挙動が異なる。そのため、スマートフォンなら、機内モードをON/OFFしたり、端末を再起動することで、ネットワークに再登録され、使えるようになる。

 本誌読者のように、モバイルネットワークについて、ある程度、リテラシーのあるユーザーなら、「再起動すれば、つながるかな?」「ちょっと機内モードをON/OFFしてみよう」と考えそうだが、一般の多くのユーザーはそこまで気が回らないことが多い。だからこそ、記者説明会でメディアが集まっているタイミングで、「復旧時には機内モードのON/OFFや端末の再起動を試すことを伝えて欲しい」とアナウンスすべきではなかっただろうか。

 今回の障害に際し、金子恭之総務大臣は、5日の定例会見において、情報の周知に課題があることを指摘していた。今回は障害に関する情報の周知が不足したことで、ユーザーに混乱を招いたことは確かだが、自前のネットワークがほぼ使えないという障害は、過去にもあまり例がない。もちろん、障害を起こさないことは大前提だが、もし、万が一、今回のような事態になったとき、どのような対応を採ることができるのかは、監督官庁として、しっかりと業界全体をまとめて、方針を示して欲しいところだ。

万が一の事態にどう備えるか

 今回のように全国規模でモバイルネットワークが使えなくなるような事態は、起きて欲しくないが、それでも現在のように、モバイルネットワークが高度化し、複雑化している状況を鑑みると、今後、同様の障害が起きないとは言い切れない。障害を起こさないことはベストだが、ユーザーとしては、万が一の事態にどう備えるのかも考えておきたい。

 今回の障害に対するユーザーの対応状況を見てもわかるように、いくつかの対策が考えられる。なかには金銭的な負担が増える対策もあるが、スマートフォンや携帯電話がまったく使えないという事態を考えれば、準備をしておいて、損はないだろう。

自宅にWi-Fi環境を

 まず、最初に考えられるのは、前述の飲食店の話のように、Wi-Fiでインターネットに接続できる環境を整えておくことだ。インターネットに接続できれば、後述するように、LINEやFacebookメッセンジャー、Skypeなどでメッセージのやり取りができるうえ、サービスによっては音声通話も使えるからだ。

 自宅に光回線などの高速インターネット回線(ブロードバンド回線)があるユーザーなら、おそらくほとんどの人が設置済みだろうが、無線LANアクセスポイントを設置しておく。

 普段、使わない家族にも接続方法を説明したり、他のスマートフォンも接続しやすいように、接続情報を表わすQRコードなどを貼っておくのも手だ。

街中のWi-Fiスポットも利用できるように

 また、自宅以外にいるときを考慮し、街中のWi-Fiスポットも利用できるようにしておきたい。各携帯電話会社が提供するWi-Fiサービスは、かつては自社ユーザーのデータ通信のオフロードのために提供されていたが、現在は各社のポイントサービスに紐付くアカウントのために提供されていることが多い。

 たとえば、NTTドコモの「d Wi-Fi」はNTTドコモと契約していなくてもdポイントを貯めるときに使う「dアカウント」を登録してあれば、利用できる。auが提供する「au Wi-Fiアクセス」もau PAYに登録していれば、誰でも無料で利用できる。できれば、こうしたサービスのアプリをインストールし、セットアップしておき、自宅や近所のWi-Fiスポットも把握しておくといいだろう。

スマホ2回線という手も

 通信手段を確保するもうひとつの対策としては、やはり、今どきのスマートフォンならではの「デュアルSIM」と「2台持ち」が考えられる。

 「デュアルSIM」はスマートフォンの機能のひとつで、2枚のSIMカード、もしくは1枚のSIMカードとeSIMなどの組み合わせで利用できる機能を指す。

 片方のSIMカードスロットに、いずれかの携帯電話会社やMVNO各社のSIMカードを挿しておき、もう片方には異なるネットワークを利用したSIMカードを挿しておくことで、万が一の事態のときは、有効な方の回線で音声通話やデータ通信を利用するわけだ。

 かつてはそれぞれのSIMカードを切り替えて利用していたが、現在は「DSDV(Dual SIM/Dual VoLTE)」が一般的であり、2つの回線で待受をしたり、発着信ができる。一部の機種と環境では、DSDV利用時に緊急通報が利用できないなどの事例が指摘されていたが、これらの事象は順次、解決されつつある。

 ちなみに、デュアルSIMはオープン市場向けのSIMフリースマートフォンの多くが対応しているが、 iPhoneは2019年に発売されたiPhone XSシリーズ以降がeSIMに対応 しているため、nanoSIMカードとの組み合わせで、デュアルSIMを実現できる。

 各携帯電話会社で購入した場合は、eSIMを追加する場合でもSIMロック解除が必要になるので、その点だけは気をつけたい。また、各携帯電話会社がAndroidスマートフォンは、基本的にシングルSIMのモデルばかりだったが、こちらもSKUの共通化の影響などもあり、eSIMとの組み合わせによるデュアルSIM対応のモデルがいくつか販売されている。

 「2台持ち」については、基本的にデュアルSIMと同じアプローチで、異なる回線契約のSIMカードを2台の端末に挿しておく。「2台持ち」というと、やや変わった使い方のように捉えられがちだが、最近では個人用と別に、会社から支給されたスマートフォンを利用することも多く、用途ごとに使い分けるため、2台のスマートフォンを持ち歩く若い世代(女性も)も街中でよく見かける。

 デュアルSIMにせよ、2台持ちにせよ、複数の回線を契約するため、1回線のときより、経済的な負担は増える。ただ、povoのように、月額0円で維持できる携帯電話サービスもあるうえ、楽天モバイルやLINEMO、IIJmioなどのように、月額1000円以下で利用できるサービスもある。ここ数年、せっかく政府によって、携帯電話の料金プランが値下げされたのだから、これを機に、バックアップや併用するための回線を追加しておいてもいいのではないだろうか。

 Wi-Fiや他の携帯電話サービスで、通信手段が確保できても今回のように音声通話が利用できなくなると、音声によるコミュニケーションが難しくなってしまう。

 このようなときは、LINEやFacebookメッセンジャー、Skypeなどの音声通話機能を使ったり、テレワークで利用が拡大したZoomやGoogle Meet、Microsoft Teamsなどのビデオ会議ソフトを使えば、音声によるコミュニケーションが可能だ。もし、電話番号が必要ということであれば、「050 plus」(NTTコミュニケーションズ)や「Viber」(楽天)、「LaLa Call」(オプテージ)などを契約し、「050~」で始まる電話番号を取得しておくのも手だ。

障害が起きないことは大事だが、周知と備えも大事

 今回のKDDIで起きた障害は、スマートフォンや携帯電話に加え、さまざまなサービスに影響が及ぶことになった。KDDIは今回の障害を受けて、「詳細な原因究明」「再発防止策の策定」「お客さま周知の在り方」を検討するとしている。一部で指摘されている補償については、まだどういう形になるのかがわからないが、ひとつの区切りとけじめを付ける意味でも何らかの方針を示す必要がありそうだ。

 モバイルネットワークはハードウェアとソフトウェアで構成された設備を使い、運用されているものであるため、私たちが利用するパソコンなどと同じように、何らかのトラブルが起きるリスクを抱えている。

 そのリスクを回避するための定期メンテナンスだったのかもしれないが、今回の障害から得られた情報や知見を業界全体で活かし、今後は被害が拡大しないように、さまざまなケースを想定しながら、しっかりと準備を進め、常に安定した運用をお願いしたいところだ。同時に、普段から、いかにユーザーに情報を周知し、理解してもらうかなど、情報を伝えることにもしっかりと取り組んでいただきたい。

 私たちユーザーとしては、万が一のときに備え、いろいろなシチュエーションに対応できるように、環境を整えておく必要がある。そして、今回のような障害は起きて欲しくないが、こうしたトラブルが起きたとき、不確かな情報に惑わされないように、確実な情報をしっかりと見極めるようにしたい。