東洋経済オンラインは、新型コロナの国内感染状況について特設サイトでデータを公開している。大量のデータを見やすく整理しているが、このサイトは担当者がデータ入力をほとんど手作業でやっている。参照している厚労省のデータがPDFや画像のため自動化が難しく、頻繁に公開形式も変わる。結局、目で見て入力するのがいちばん速いからだ。
厚労省だけではない。都道府県では、東京都が比較的モダンなデータ公開サイトを作った後、大阪府や神奈川県などが全く同じ作りのサイトでデータを公表しているが、オープンデータは一部に限られている。大阪府の特設HPにはオープンデータはない。
こうした情報公開に問題はないのか。濱岡教授は次のように話す。
定義がコロコロ変わり、集計方法もあいまい
「政府や自治体が公表している数字は、定義がコロコロ変わるし、検査人数と検査件数が混在するなど集計方法もあいまいです。厚労省の専門家会議が出す数字も、どのように推定しているかが公開されていません。厚労省の新型コロナクラスター対策専門家が、GitHubで詳細を公表するというので楽しみにしていたら、PDFの説明資料が出ているだけでした。GitHubはプログラマーがデータを共有する場所なのに、PDFなんですよ」
「5月12日になって実効再生産数のプログラムは公開されました。しかし、『接触を8割減らす必要がある』などとした根拠は今も公開されてない。そうした基本的な情報を公開しない一方で、『新しい生活様式』など、本来なら政治家が言うような提言をしています。科学者として踏み越えた面があり、疑問を感じます」
欧米の状況を見ると、日本のマスコミもよく引用するアメリカのジョンズ・ホプキンス大学はGitHubでデータを公開している。インペリアル・カレッジ・ロンドンやハーバード大学などはシミュレーションのためのソースコードも公開している。
「推定した結果だけでなく、そのために用いたモデル、データを公開してもらわないと妥当性を検証できません。公開すれば、第三者が確認したり、もしかするとより良いものにできたりするかもしれない。何よりも、『数字が操作されているのではないか』といった変な臆測を呼ぶことも少なくなると思います」
取材:木野龍逸(きの・りゅういち)=「フロントラインプレス(Frontline Press)」
記事をマイページに保存
できます。
無料会員登録はこちら
ログインはこちら
印刷ページの表示はログインが必要です。
無料会員登録はこちら
ログインはこちら
無料会員登録はこちら
ログインはこちら