25日のドコモ通信障害、トラフィック想定の見積もり足りず
NTTドコモは、1月25日に発生した通信障害について、その詳細を紹介する報道関係社向け説明会を開催した。説明を行ったドコモ取締役常務執行役員(ネットワーク担当)の岩崎文夫氏は、冒頭、「お客さまに多大なご迷惑をおかけしたことを深くお詫び申し上げます」と謝罪した。
同社によれば原因はパケット交換機。ただし、パケット交換機は設計通りの能力を発揮したが、その能力を超えるトラフィックが発生し、処理しきれなかった。そのパケット交換機は、スマートフォンの急増に対応するため、従来よりも設計思想を変更し、能力を向上させた新型機。ドコモでは、新型パケット交換機の導入にあたって通信状況の想定を行っていたものの、実際にはその想定を超える通信が行われており、新しいパケット交換機の処理能力が足りなかった。
ほぼ同時刻にJR東日本の首都圏鉄道網に乱れがあり、一時は鉄道の障害がトラフィック増を招いたとの見方もあったが、鉄道のトラブルは首都圏ではそれなりの頻度で発生している。ドコモ側も鉄道トラブルによる通信増はあったものの、2倍、3倍と急増するレベルではなかったとして、通信障害の原因とは見なしておらず、あくまで「ドコモの見積もりの甘さ」が原因と説明した。
ドコモにおける、最近の大規模な通信障害は、12月下旬にspモードで、他人のメールアドレスになるという事象が発生している。それから約1カ月、異なる原因とはいえ、スマートフォンの急増への対応を背景にした通信障害が立て続けに発生したことで、記者会見ではドコモ側の設備増強が追いついていないのか、あるいはドコモのネットワークに特殊な要因があるのか、問いただす声が多く挙がった。
今回の会見では、今後実施する対策について紹介されたが、さらに26日の第3四半期決算会見でも代表取締役社長の山田隆持氏から、さらなる対策などが説明される予定。
■通信障害の内容
時系列で見た通信障害 |
発生事象の概要 |
25日の通信障害は、スマートフォンの契約者増に対応するため、25日未明に新型パケット交換機を導入し、その設備への切り替えを実施したところから始まる。この新型パケット交換機は、群馬県内のビルに設置され、20日に先行的に導入された。
20日の時点では新宿区・文京区・江東区・江戸川区・墨田区・葛飾区・港区・千代田区・渋谷区にある無線制御装置(基地局を管理する装置)23台が、旧型から新型のパケット交換機に切り替わった。20日~24日までは、新型パケット交換機がうまく動作するか、安定して運用できるか確認し、特に問題もなかったことから、25日未明には目黒区・大田区・品川区・世田谷区・中央区・港区・千代田区・渋谷区を担当する無線制御装置37台も新型パケット交換機に繋がることになった。
25日の工事は3時40分に完了。その後、8時26分頃よりトラフィック(通信量)が徐々に増加し、新型パケット交換機の動作が不安定になり、“制御信号”と呼ばれる信号が全てやり取りできず、破棄される事象が発生し、パケット通信が繋がりにくい状況となった。こうしてパケット通信が繋がりにくくなっているところに、9時9分、一部のエリアで局所的にトラフィックが増え、基地局の一部が自動的に音声通話とパケット通信の規制を実施した。これは基地局がもともと持つ“自律規制”と呼ばれる機能で、一定以上のトラフィックになれば自動的に起動する。
自律規制が発動した基地局では20分も経たずにトラフィックが落ち着き、自律規制は解除された。しかしパケット交換機側は輻輳(ふくそう、通信処理が滞る状況)が解消されなかったため、ドコモのネットワーク担当部署で、手動による規制を実施。この段階で30%の規制がかかり、パケット通信が繋がりにくくなった。
ここまでは、ドコモ側も一時的なトラフィック上昇が輻輳の原因と見ていた。しかし、規制を行っても輻輳が解消されないため、原因は別にあるとして、10時56分から旧型のパケット交換機に戻す作業を開始。もとのパケット交換機に繋がった基地局から、徐々に規制が解除され、13時8分に全ての規制が解除となって通信障害から回復した。
こうした流れで、最大252万人のユーザーに影響があったと見られている。障害をもたらしたのは、25日未明に導入された新型パケット交換機の処理能力が、実際のトラフィックを処理するには足りなかったため。ドコモ側が考えていたトラフィックの想定量に対して、新型パケット交換機は余裕を持った能力を備えていたものの、現実のトラフィックはドコモの想定以上だった。
■トラフィックを想定、しかしパケット交換機の能力が足りない
パケット交換機には、どういった能力が足りなかったのか。これまでのパケット交換機は、11台で構成されている。その処理能力は、同時接続数が88万台、処理できる1時間あたりの信号量は2750万となっている。
一方、約1年前に仕様がおおむね固まり、開発が進められ、1月20日から導入された新型パケット交換機は3台構成で、同時接続数は180万台、処理できる1時間あたりの信号量は1410万となっている。どちらも複数の機器で構成されているが、1台あたりの能力で見ると、現行型と比べ、新型は同時接続数が7倍、信号量は2倍と処理能力が向上した。
新型への切り替えの概要 | スマートフォンはアプリの追加で通信頻度が上がり、制御信号も増える |
同時接続数のほうが大きく向上しているのは、スマートフォンが常にネットワークと接続しようとする性質であり、その状況に対応するため。これまでのiモード端末は、スマートフォンよりも圧倒的にネットワークと接続する機会が少なく、スマートフォンは10倍ほど通信量が多い。就寝中など、ユーザーが操作していなければ、iモード端末はあまりネットワークと繋がらないが、スマートフォンはかなり頻繁にネットワークと繋がる。ドコモの調べでは、アプリを一切搭載していないAndroid端末は28分に1度、接続するが、アプリが搭載されていればいるほど、接続の機会は増える。それがVoIP、チャットを行うリアルタイム性の強いアプリであれば、さらに接続頻度は向上する。そこで、同時接続数を増強したパケット交換機が必要と判断した。
現行型と比べ、新型の処理能力は1台あたりでは増強されているものの、構成全体で見れば、1時間あたりの信号量の処理能力が大幅に落ちているように見える。通信を行う際には、その前の段階で、サーバーとの接続を確立するための通信が行われる。ここでやり取りされるのが“制御信号”と呼ばれるもの。今回の通信障害は、同時接続数に余裕があったものの、制御信号をさばく能力(1時間あたりの信号量)が足りなかったことが原因だ。
想定トラフィックとパケット交換機の能力 |
この点について、ドコモは「現行型には2750万という信号処理能力があるものの、実際にはそこまでの信号が発生していない」と説明。現行型では、台数を増やして同時接続数を増強し、それにあわせて信号処理能力も増えたが、実際にはその能力がフルに使われていなかったため、余分な能力と見なされていたことになる。
ドコモでは、新型パケット交換機の導入にあたり、トラフィックの想定を算出。今回は同時接続数が約71万台、1時間あたりの信号量が1200万と見積もった。実際は、同時接続数こそあっていたものの、1時間あたりの信号量が1650万と、想定よりも450万も多かった。新型パケット交換機の能力を240万も超えてしまい、処理ができなくなった。
想定以上のトラフィックが実際には発生していたことに対応できなかったドコモは「見積もりが甘かった」と不手際を認める。想定トラフィックの算出方法はiモード時代と大きく変化していないとのことで、端末のハードウェアの能力を元に、どの程度の通信を行えるか、そしてどの程度普及するか、といった予測を出し、トラフィックの想定量を算出する。ただ、これまでは台数ベースで考えればよかったが、スマートフォン時代はアプリの追加で、信号量が増えることになり、見積もりの甘さに繋がったという。
新型パケット交換機には、これまではなかった信号量の測定機能を新たに搭載し、2月中旬までに全国約200台のパケット交換機の能力を一斉に点検する。また制御信号が想定よりも多かったことに対応すべく、パケット交換機を2月中旬以降に増設する。さらに、新型パケット交換機1台あたりの能力(リソース)を、同時接続数と1時間あたりの信号処理能力でどうバランスをとるか、8月中旬までに最適化を図る。
今後の方針 |
スマートフォンのアプリが制御信号の増加を招いていることは、昨年11月、韓国のKTからの報告でドコモ側も認識していた。しかし今回のトラフィックの見積もりにその情報は反映されていなかったという。世界の携帯電話事業者による業界団体「GSMA」内でも、スマートフォンによる制御信号の増加は課題とされており、今後、グーグルなどと協力し、GSMA内で対策に取り組む。
「VoIPやチャットといったアプリが制御信号を増加させている」と指摘があるものの、ドコモでは具体的なアプリ一覧を提示していない。他のアプリと比べ、リアルタイムに通信を行い、他のアプリよりも通信頻度が高いことが、そうした指摘の裏付けになっている。アプリが与える影響について、ドコモは今後、さらに調査を進める方針だが、「スマートフォンではアプリを自由に使えるのが魅力の1つ。ドコモでは、そうした部分を規制したくはない」(岩崎氏)として、アプリの規制が近々に行われることはないようだ。また組織の硬直化など、企業としての課題・問題点の有無についても今後点検する方針。
2012/1/26 11:53