ニュース
不眠不休でドコモのネットワークを守る「ネットワークオペレーションセンター」のひみつを探る
2019年8月30日 20:33
NTTドコモは30日、東京都品川区にある同社のネットワークオペレーションセンターを報道陣向けに公開した。
ネットワークオペレーションセンターとは
ネットワークオペレーションセンター(以下、オペレーションセンター)とは、NTTドコモが全国に敷いているネットワークの障害や異常などの監視を行っている施設。24時間365日休むことなくオペレーターがモニターを通して全国の回線を見張っており、万が一なんらかの異常が検知された場合は、即座に対処に当たる。
ドコモのオペレーションセンターにおいて監視している要素は主に4つ。基地局や制御装置などのアクセス系、音声通話やパケット通信などの通信を行うノード系。そしてノード系とアクセス系をつなぐためのリンク系、ネットワーク状況の監視の4種類。ドコモのネットワークを構築する装置の合計は全国で120万装置にもなる。
これらの装置すべてを東京都品川のネットワークオペレーションセンターと大阪府南港の西日本オペレーションセンターの2箇所で監視、保守をしている。具体的には北海道から東海地方をネットワークオペレーションセンターが、関西から九州沖縄までが西日本オペレーションセンターの担当地域となる。
2カ所のセンターは情報の共有を行っており、どちらか一方のセンターが災害などで機能不全に陥っても、もう片方のセンターが業務を引き継げるようになっている。とはいえ、双方の建物は、耐震・免震構造で自家発電装置も備え、品川には水害発生時の冠水を防ぐ機構が備わっている。
ネットワークオペレーションセンターはおよそ200人ほどの人員を擁している(東西合計で400名ほどになるという)。写真のモニターは、アクセス系とリンク系のモニター画面。1行表示が1つの基地局の状態を示している。
赤はサービスに影響のある障害の発生、青は回線の混雑、黄色は混雑解消のための通信制限中、緑は措置により障害から回復したことを表している。なお、右横にあるアルファベットは作業の優先順位を示す。点滅する表示は、新しく警報が発せられた基地局となる。
ひとつの基地局で障害が発生したとしても、ほかの基地局がカバーできるため実際にサービスに支障をきたすことはあまりなく、障害を起こした場所については瞬時に分かるという。
上の写真は、交換局の状態を表しているもの。パケット通信や音声通話、留守番電話サービスの監視を行っている。画面表示の意味は上述の基地局や伝送ノードの監視と同じとなっている。
昨年、他社で大規模な通信障害が発生した事例があった。ドコモとしても他人事ではなく、証明書の有無や抜け漏れがないかなどの総点検を行ったという。結果として、問題はなかったが、そうした業務プロセスも含めて検討し障害発生の可能性を可能な限り排除する取り組みを行った。
「サイレント故障」への対処
ネットワークオペレーションセンターで故障を検知し対処できるのは、それぞれの機器に故障を検知する自己診断機能が備わっているためだ。多くの場合、ネットワークオペレーションセンターからの遠隔措置(装置の再起動など)で障害は解消するという。
遠隔で対処できなかった場合、作業員を現地へ派遣し復旧作業を行う。こうした障害は年間に10数万件起きているとNTT ドコモ ネットワーク本部 サービス運営部 オペレーションシステム担当部長 沼尻政吾氏は語る。
一方で「サイレント故障」という故障警報で通知されない故障が存在し、その件数は年間数万件に上る。装置は冗長性を考慮した設計になっているため、すぐさま通信障害などにつながることはないが、やがて大きな障害につながる可能性があり、「サイレント故障」への対応が課題となっている。
ネットワークの監視業務にAIを活用して解決する試みを実現した。ドコモの通信装置の場合、トラフィック量や通信状態等のデータを取得できる。これを利用し、正常時と異常時のトラフィックパターンをAIに学習させ、それを監視させることで装置が正常か異常かを判断、サイレント故障の検知に成功している。
沼尻氏によると、ドコモでは、段階的に監視業務でのAIの比率を高めていくという。現在はネットワークの監視業務のみだが、故障箇所の推定などの分析、さらには障害が起きた装置への措置をAIで行うとしている。
激甚災害への対応
ネットワークの保守には災害時の適切な対応も欠かせない。ドコモでは、「災害対策3原則」、システムとしての信頼性向上、重要通信の確保、通信サービスの早期復旧を掲げている。
しかし、近年は想定を上回るほどの激甚災害の発生が見られるようになった。2011年の東日本大震災はその筆頭で、長時間の停電によるバッテリーの枯渇や伝送路の切断、地震や津波などによる直接被害を防ぐことができず、新たな災害対応基準策定のきっかけとなったとNTTドコモ ネットワーク本部 サービス運営部 災害対策室 室長 瀧本恭祥氏は語る。
重要なエリアの通信を確保し、災害時に使用する大ゾーン基地局の設置、重要基地局の無停電化、24時間駆動のバッテリーにより都道府県庁などが通信を使えるよう予備電源の強化を行っている。また、被災エリアでの衛星やマイクロ回線を利用した応急復旧装置の充実や小型軽量な設備での迅速な復旧、衛星携帯電話の即時提供を実現、加えて、災害用音声お届けサービスなどの開発がある。
過去には、災害発生時に「ドコモ携帯があと4時間で使えなくなる」といったデマが流布されたこともあるが、そうしたことをTwitterなどで否定すべきかなどは、それが新たな誤解を招く可能性もあるため、その都度検討していきたいという。
瀧本氏はドコモではさらなる災害対策を推進しており、平時から災害に備え万一の発災時には迅速な対応、その後の反省をもとに継続的なブラッシュアップをしていくと語った。
ケータイ Watchをフォローして最新記事をチェック!
Follow @ktai_watch