2008/11/13

    インフルエンザ流行のサーベイランスシステム(Google flu trends)

またしてもGoogle.すごいというか,アイデアがすごい.

11/11日発表.


Explore flu trends across the U.S.

流行予測ではなく,実際の流行状況をいち早く集約するシステム.従来のCDCのシステムより2週間早く情報が得られるとのこと.

別にgoogleが感染症事業に乗り出したわけではなく,あくまでgoogleは検索という横軸で全ての物事を考える.これまでの医療からのアイデアは定点観測や実際の届け出症例数などから流行を把握するのだが,全く違う視点から,その時期にどれだけのインフルエンザに関しての検索がなされるかを追いかけることで,流行を把握するということ.

仕組みは,

How does this work?

に.

検索する人が必ずしもインフルエンザとは限らない,という反論は当然織り込み済みで,それでも,一定の検索内容(ここのレシピは企業秘密のようだが,単なる「インフルエンザ」の検索ではなく,「流行」「治療」など何らかの組み合わせの検索の頻度を見るのだろう.単に「these search queries」としかか表現されていない)からその地域ごとのトレンドを見るとCDCの従来の報告とマッチするとのこと.

Of course, not every person who searches for "flu" is actually sick, but a pattern emerges when all the flu-related search queries from each state and region are added together. We compared our query counts with data from a surveillance system managed by the U.S. Centers for Disease Control and Prevention (CDC) and discovered that some search queries tend to be popular exactly when flu season is happening. By counting how often we see these search queries, we can estimate how much flu is circulating in various regions of the United States.


実際に上記のリンクでの過去のCDCとのデータとのマッチ(実際の%には少しずれがあるが,流行の立ち上がり時期,終息時期などは良くマッチしている)しているグラフが過去5年にわたって示され,この方法論はNatureにもacceptされた,とのこと.(方法論をもっと詳しく知りたい人は論文の下書きを見ることが出来ます)CDCの報告は実際の流行から1-2週遅れるが,googleはほぼリアルタイムとのこと.

なんと言ってもこのアイデアがすごいと思います.

注意点としては

このサービスが公開になったのはつい先日なので,今年のシーズンで一致するかどうか,最初の検証(validation phase).
州毎の流行データはこれまでCDCでは公表されていなかったようで,google flu trendsがこれから実施する州毎の流行報告は検証する対照がない(gold standard)
ILI%と形で報告される(医師への総受診数におけるInfluenza like illnessの割合)ので,実際のinfluenzaがどのぐらいかは分からない.

といったあたりでしょうか

コンセプトは流用できるので日本でも是非やっていただきたいところです.(但し日本人の検索行動が米国人と同じかは検証が必要)

また 生データをCSVファイルにてダウンロードも出来るので2次研究にも使えます(open source)

前書きのところで少し触れられていますが,花粉症トレンドや日焼けトレンドなどにも応用されることになるのでしょうか.

知恵とテクノロジーは人のしあわせのために..

0 コメント: