ニュース

グーグル、日本でも「COVID-19感染予測モデル」を公開

「これから28日間に陽性者は◯人増える」

 グーグル(Google)は、データを学習したAIに活用し、新型コロナウイルス感染症の陽性者数などを予測する「COVID-19 予測モデル(日本版)」を公開した。

 一般のユーザーも参照できるが、医療機関や公的機関の参考になるよう提供される。医療資材やスタッフ、スケージュールといった部分での計画立案や、検査実施計画、感染拡大の兆候が見られる地域の早期発見などに活用できるという。

新たな感染者数、死亡者数を示す

 予測データは、Data Studio dashboard(ダッシュボード)や、グーグルのクラウドサービスであるBigQuery、CSVファイルで公開される。

 たとえばダッシュボードには、今後28日で予測される「死亡者数」「陽性者数」や累計でのグラフなどが示される。視覚的に、感染のトレンドがわかりやすく示されることになる。

 予測値は、都道府県別単位でも見ることができる。それらの元になるデータは厚生労働省が発表するデータや、グーグルのコミュニティ モビリティ レポート、平成27年(2015年)の国勢調査結果などだ。

 たとえば、人がどの程度移動しているかというデータのひとつは、スマートフォンをもとにしたコミュニティ モビリティ レポートだ。もし外出を自粛するような状況になれば、少し時間はかかるが、人々の動きがコミュニティ モビリティ レポートにも反映され、その状況が予測モデルにも反映されることになる。

 感染の拡がり方自体は、米国でも日本でも、感染の態様や拡がり方という基本条件は同じと見なされている。もし、日本独自の要素、たとえばマスクの着用率などが異なり、それが影響するのであれば、これまでに学習した陽性者数などに反映されているはず、という考え方も取り入れられている。

 これまでのデータと、感染の拡がり方(感染症の数理モデル)をもとに機械学習で予測値を導き出しているのがグーグルの予測モデル。用いられるデータは日本のデータセットのみとなる。

日本初の予測モデル

 グーグルはこれまで米国において、ハーバード大学のグローバルヘルス研究所と協力して、米国版の予測モデルを提供してきた。同社広報によれば、都道府県単位で、一般公開される予測モデルは日本で初めてのもの。

 予測モデルでは、「Susceptible(感染前の状態、免疫なし)」、「Exposed(ウイルスにさらされたものの、ほかの人に感染させない状態)」「Infected(他者への感染力がある状態、発症)」「Recovered(回復し免疫を獲得した状態、あるいは死亡した状態)」という4つの区分を用いている。さらに、入院、療養など患者数といったモデルも用いられている。

状態内容
Susceptible感染前の状態、免疫なし
Exposedウイルスにさらされたものの、ほかの人に感染させない状態
Infected他者への感染力がある状態、発症
Recovered回復し免疫を獲得した状態、あるいは死亡した状態

 機械学習により、過去のデータをもとに、それぞれの状態がどのような影響を与えるか考慮する。公開前の検証として、たとえば10月1日までのデータでトレーニングした場合、10月2日~30日の予測値と実際の結果を確認し、精度が優れていることを確認したという。なお、慶應義塾大学 医療政策・管理学教室の宮田裕章教授らが監修した。定期的に、データの学習が実施され、高い精度を維持する。

 ただし、最新情報の反映には1~3日ほどかかる。また、もしPCR検査の方針が大きく変わるなど、状況が急激に変化する場合も、予測値への反応にはある程度の時間がかかる。

 また、あくまで予測であり、その内容は刻々と変わる。トレンドを示す参考値でしかないが、具体的な数字で示されることで、多くの人にとって、感染症が今、どういう傾向にあるのか、とてもわかりやすいものとなっている。

 グーグルでは、参考情報のひとつとして公開することにしたと説明。複数のデータとあわせて活用するよう呼びかけている。