政府の要請と前後するタイミングで、独自に動き出す企業も出始めている。アメリカのグーグルは4月3日、ユーザーのスマートフォンなどから収集する位置情報を基に解析した店舗や駅の混雑状況の変化に関するリポート(https://www.google.com/covid19/mobility/)を外部公開した。外出自粛などの新型コロナ対策によって人の動きがどう変わったかをデータで示し、自治体や専門家による分析や意思決定を支援する狙いだ。
現在公開されているのは、日本を含めた世界131の国と地域のデータ。「娯楽関連施設」(飲食店やテーマパークなど)、「食料品店やドラッグストア」「公園」「公共交通機関」「職場」「住宅」という6つのカテゴリーごとに、訪問・滞在者数の増減率がグラフ化されている。増減率は1月3日からの5週間の中央値と、2月16日以降の値を比較し算出している。
例えば3月29日(日)の娯楽関連施設について見ると、東京が26%減なのに対し、自宅待機令が出ているアメリカ・ニューヨークは62%減、イギリス・ロンドンは87%減とかなり差がついた。東京ではまだまだ外出の自粛が進んでいなかったことがわかる。
プライバシー保護の工夫
思い切ったデータの公開であるだけに、プライバシー保護にもかなり気を遣っているようだ。東洋経済の3月末の取材にも「統計的な集計データを活用した対策支援を検討しているが、どんな方法においても厳格なプライバシープロトコルにのっとり、あらゆる個人情報を共有することはない」(グーグル日本法人広報)と答えている。
実際、いろいろな工夫が盛り込まれている。今回のリポートのデータは、グーグルが「ロケーション履歴」という仕組みを通じ収集している位置情報だ。これは普段、地図サービス「グーグルマップ」上で店舗の混雑状況や交通状況の表示にも使われている。ユーザー個人が設定を行っていなければ、ロケーション履歴は通常「オフ」になっている。「オン」に設定しているユーザーも、アカウントの設定画面から設定を切り替えたり、履歴の削除を行ったりできる。
こうして収集したデータは平時の活用においても匿名化、統計化の処理が成されている。今回のリポートもその過程を経て公開されている。個人の位置や連絡先、移動履歴などは一切含まないという。また、リポートは訪問者数の増減率を示すのみで、訪問者の実数は含まない。
グーグルはデータの匿名性を担保するために、「差分プライバシー」と呼ばれる技術も用いている。データセットの中にあえて「ノイズ(ランダムなデータ)」を入れ込むことによって、データと個人の紐付けを事実上不可能にするものだ。2016年にアップルがスマホOS「iOS」でこの仕組みを採用したことで話題となった手法でもある。