ケータイ用語の基礎知識

第629回:モバイル空間統計とは

 「モバイル空間統計」とは、携帯電話の通信ネットワークの仕組みを用いて作成される“人口の統計情報”です。NTTドコモが取り組んでいるもので、地域ごと、あるいは時間ごとに、そこにいる人口の年齢層、性別、居住エリア別の分布を推計できます。

 たとえば、「ある日曜日の午後3時、秋葉原にいる30代男性の人数」といったデータ、あるいは「都市部の住宅街である○市周辺の平日昼間の人口と、平日夜間の人口」といったデータを出すことができるのです。こうした統計情報を算出する際に利用されるデータは、位置情報、年齢、性別、居住エリアです。一方、「氏名」「電話番号」「生年月日」など個人を特定するような情報、プライバシーに関わる情報は除去されています。

 ドコモでは、この10月から「モバイル空間統計」として収集したデータを、ドコモの子会社であるドコモ・インサイトマーケティングを通じたリサーチ事業として、他企業や団体にも提供します。

ビッグデータを活用

 こうした人口分布の統計情報は、これまでも存在しています。たとえば総務省統計局は、住民台帳や国勢調査に基づいて、日本の人口を集計しています。

 しかし、この方法では、住民登録している住所に基づいて人口を推計するために、「平日の正午、成人男性の人はどこに多くいるか」など特定の日時や場所にまつわる情報を得ることはできませんでした。

 ドコモが開発した「モバイル空間統計」では、携帯電話の通信ネットワークで得たデータ(基地局の運用データ)を利用して、地域ごとの人口の分布や、性別・年齢層別・居住エリア別の人口の構成を知ることができます。ではどうやって調査しているのでしょうか。

 一般的に、携帯電話は、通話や通信をしていなくても、電源が入っていれば携帯電話と基地局の間で、周期的にやり取りして、どこに誰の携帯電話があるか、ネットワーク側はわかるようになっています。もし電話がかかってきたり、メールが送られてきたりすると、ユーザーのいる場所を把握しているおかげで、いつでもどこでも、すぐに着信できるようにしているわけです。

 こうした基本的な携帯電話の仕組みに加えて、携帯電話会社が持っているユーザーの属性を掛け合わせます。こうすることで、ざっくりとしたエリアの人口、あるいは性別や年齢層で分類した人の数などがわかります。ただし「モバイル空間統計」ではユーザー1人1人を追跡しているわけではありません。

 現在、携帯電話の通信ネットワークは日本全国で、24時間365日、運用されていますから、全国すべての市区町村など大規模な調査対象、あるいは特定のエリアの人口、昼間や夜間の人口、ある時刻の人口など、さまざまな切り口で推計データを提供できます。

 「東京・秋葉原では男性が多い」「原宿では若年層の女性が多い」といった話は、なんとなく納得できそうな気はしますが、実際にはどうなのか、「モバイル空間統計」によって、数字での裏付けが可能になります。たとえば、都市部周辺から都心部へ入ってくる人口(流入人口)も数字で確認でき、ベッドタウンから首都圏で働く人口もわかる、ということになります。

 これらの推計されたデータは、年間で膨大な量となり、いわゆる「ビッグデータ」と呼ばれます。最近のコンピュータ技術の進化により、このようなビッグデータを処理、分析できるようになり、巨大なデータから非常に高度な知見や洞察を導き出すことが可能になったのです。

 ちなみに、「モバイル空間統計」は、都市部では500m程度、郊外では1km以上のメッシュで区切られています。十分なサンプルが確保できる年齢層のユーザーが対象となっているため、14歳以下、そして80歳以上のユーザーは推計データに入っていません。さらに基地局の運用データが扱わない、一ユーザーの長期間にわたる位置情報(移動経路)や、国際ローミングなど海外ネットワークでのデータも、調査の対象外になっています。

プライバシーデータの漏洩、悪用される心配はない

 この種のビッグデータを扱うビジネスでは、プライバシー情報の取り扱いを心配する人もいるでしょう。今回紹介する「モバイル空間統計」では、先述したように、集計前に個人を特定するデータは除去されています。また後述する3段階の処理によって、個人データを保護する仕組みが取り入れられています。そのため、「モバイル空間統計」がどこかの企業に提供されていたとしても、名前や住所など個人のプライバシーデータは含まれていませんし、漏洩したとしても、個人情報まで漏れる心配はありません。

 モバイル空間統計で、ドコモ・インサイトマーケティングを介して、他の企業や団体に提供される情報は、“集団の人数のみをあらわす人口統計情報”であるため、この統計からユーザー個人を特定することはできないのです。

 このモバイル空間統計を作成する際、ドコモではデータの「非識別化」「集計処理」「秘匿処理」と、3つのステップを踏んで処理を行い、個々人のデータを保護しています。

 最初の「非識別化処理」では、ユーザーデータを、個人を識別できないデータに変更する処理です。通常の携帯電話の通信ネットワークは、通話・通信を行うため、基地局側で今エリア内にいる携帯電話がどの電話番号かは把握しています。この情報にユーザー情報をマッチさせると、誰がどこにいるかわかるわけですが、「非識別化処理」によって、「性別:男性」「年齢:40代」「エリア:A県B市」とシンプルな形のデータに置き換えます。

 続いて「集計処理」では、ドコモの携帯電話の普及率を加味して人口を推計します。たとえば、A県B市では人口の3割がドコモのユーザーである場合、ドコモ側で「A県B市のドコモユーザーが○人」であることがわかると、A県B市の人口はその3倍の人と仮定できます。

 最後の「秘匿処理」では、少人数のデータは除去する、という処理が行われます。つまり「500m四方のメッシュに6人しかいない」というデータの場合、6人が誰か、他のデータと組み合わせれば特定される可能性が高まります。このようなデータは除去され、「データなし」として処理されるのです。

モバイル空間統計では、「非識別化」「集計」「秘匿」の3つの処理を行うことによって人口を推計する。プライパシーデータは、ここでは、漏洩しない

 以上のように、プライバシー情報が除去され、さらに保護される処理が行われていますが、ユーザーが希望すれば、自分の携帯電話の情報を「モバイル空間統計」の対象から外すことも可能です。

 もし対象から外したい場合は、電話窓口(ドコモユーザーは151、一般電話などは0120-800-000)に電話して申し込みます。ちなみに対象外になったユーザーの分は、「モバイル空間統計」からドコモの携帯電話の普及率を減らす形で処理され、統計全体の正確性には影響は出ません。

大和 哲

1968年生まれ東京都出身。88年8月、Oh!X(日本ソフトバンク)にて「我ら電脳遊戯民」を執筆。以来、パソコン誌にて初歩のプログラミング、HTML、CGI、インターネットプロトコルなどの解説記事、インターネット関連のQ&A、ゲーム分析記事などを書く。兼業テクニカルライター。ホームページはこちら
(イラスト : 高橋哲史)